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Avant-propos 


Cet ouvrage est consacré à la théorie de la Relativité Générale, c’est-à-dire à la 
synthèse de la relativité et de la gravitation. Cette Gravitation Relativiste, comme on 
dit plutôt aujourd’hui, apparaît ainsi comme étant de première importance dans tous 
les phénomènes de l’ astronomie qui font intervenir soit des vitesses comparables ou 
égales à celle de la lumière, soit des champs de gravitation intenses. L'ensemble de 
Tétude de ces phénomènes constitue ce que l’on appelle l’ Astrophysique Relativiste, 
une expression due à Alfred Schild (1967). Ce que nous nous proposons d’exposer 
ici constitue le minimum minimorum de la théorie relativiste de la gravitation 
nécessaire pour aborder cette discipline relativement récente. 

A ce stade, il peut être intéressant de rappeler brièvement la genèse de ce nouveau 
domaine et, plus particulièrement, la façon dont il est lié à la Relativité Générale. 
A cette fin, il est nécessaire de se souvenir qu’une fois les «tests classiques » de la 
Relativité Générale vérifiés [déviation des rayons lumineux au voisinage du Soleil 
(1919); décalage spectral vers le rouge (dans les naines blanches : W.S. Adams 
(1925)); avance du périhélie de Mercure], cette discipline s’était alors embourbée 
dans des voies assez formelles parce qu’alors, les technologies disponibles ne 
permettaient pas qu’elle fût en contact ni avec l’expérience, ni avec |’ observation 
astronomique. Bien que les recherches effectuées fussent souvent d’un grand intérêt 
conceptuel (théories unitaires de la gravitation et de l’électromagnétisme, par 
exemple) et théorique (développements mathématiques divers), la relativité tournait 
un peu en rond [J. Eisenstaedt (1986)] en raison de l’absence d’expériences de 
laboratoire et/ou d’ observations d’ objets spécifiquement relativistes, inconnus au 
niveau théorique avant les années trente et, dans une large mesure, quarante voire 
cinquante. Ainsi, la cosmologie était bien davantage considérée comme un «espace 
de liberté pour penser la relativité» [J. Eisenstaedt (1989)] que comme un champ 
de vérifications astronomiques possibles de la Relativité Générale, ou même la 
«science de l'Univers» [E. R. Harrison (1981)]. 

La découverte de l'effet Môüssbauer (1958) devait permettre la mesure du 
décalage spectral vers le rouge, d’origine gravitationnelle, en laboratoire, tandis que 
les progrès expérimentaux autorisaient le renouvellement de l’expérience d’ Eötvös 
avec une précision inégalée. En même temps, après la Deuxième Guerre mondiale, 
les discussions sur la nucléosynthèse des éléments conduisaient G. Gamow et ses 
collaborateurs à l’idée que P’ Univers avait été, dans un passé lointain, dans une 
phase chaude, dont subsisterait aujourd’hui un rayonnement noir du fond du ciel. 
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Ce rayonnement fut découvert t en 1965, ce qui suscita un grand intérêt envers 
la cosmologie qui commença à se développer alors sérieusement, d’autant que, 
quelques années plus tôt (1963) les quasars — les objets les plus lointains que l’on 
connaisse — étaient observés. Peu après cette découverte, les premiers pulsars étaient 
trouvés (fin 1967), très vite identifiés par T. Gold (1969) aux étoiles à neutrons 
imaginées en 1932 par Landau. 

Ainsi, les années soixante remirent la relativité sur une base expérimentale 2 lui 
fournissant des objets d’étude astrophysique qui, jusque-là, lui avaient fait défaut. 
En même temps, la notion théorique de trou noir, ainsi que celle d’ondes gravita- 
tionnelles, étaient approfondies et des recherches observationnelles et expérimen- 
tales, respectivement, étaient entreprises afin de les mettre en évidence. Il s’agit 
là d’objets spécifiquement relativistes, susceptibles de toutes sortes d'effets astro- 
physiques et que l’on cherche, bien évidemment, à observer. Il va de soi, enfin, que 
les découvertes observationnelles mentionnées plus haut ont suscité, en retour, de 
nouvelles observations, par exemple les sondages profonds du ciel destinés à met- 
tre en évidence d’éventuelles grandes structures suggérées par tel ou tel scénario 
cosmologique. 

Il existe, à l’heure actuelle, un certain nombre de théories relativistes de la gra- 
vitation qui sont compatibles avec l’expérience et l'observation; mais la Relativité 
Générale d’ Einstein fut sans aucun doute la première historiquement à fournir des 
résultats théoriques corrects en accord précis avec les faits. Aussi est-ce à cette 
théorie, principalement, qu’est consacré cet ouvrage sans que soit abordée la ques- 
tion des étoiles denses, de l’effondrement gravitationnel ou des trous noirs : le 
lecteur pourra consulter le livre de S.L. Shapiro et S.A. Teukolsky (1983) sur ces 
points. La cosmologie non plus n’est pas développée ici : il existe d’excellents 
ouvrages comme ceux de P.J.E. Peebles (1993), N. Straumann (1984), Ya. B. Zel- 
dovich et I.D. Novikov (1975) ou S. Weinberg (1972), etc. Il s’agira ici, non pas 
tant d’un exposé de la Relativité Générale, que d’éléments conceptuels ou techni- 
ques minimaux permettant d’ appréhender sans difficulté particulière les aspects en 
quelque sorte gravitationnels de l’ Astrophysique Relativiste. Divers compléments 
favoriseront, en outre, l’accès à la littérature courante. Deux illustrations d'intérêt 
astrophysique seront étudiées de manière simple : il s’agit, d’une part, des lentilles 
gravitationnelles, observées ces dernières années, et d’autre part, des ondes gra- 
vitationnelles, non encore détectées en laboratoire ? mais implicitement mises en 
évidence par l’observation du pulsar binaire PSR 1913 + 16 et qui, dans le futur, 
donneront peut-être lieu à une nouvelle astronomie. 


1. L'histoire de cette découverte est racontée par S. Weinberg (1978); voir aussi E.R. Harrison (1981) 
ou R. Hakim (1992). 

2. A cela il convient d’ajouter, pendant ces mémes années, les progrés des techniques spatiales 
permettant des expériences impossibles à réaliser sur Terre. 

3. Une coopération franco-italienne, le projet VIRGO, en cours de réalisation, devrait peut-être 
permettre leur mise en évidence d’ici ]’an 2000. 
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Pour le débutant, la théorie de la relativité, qu’il s’agisse de la théorie restreinte 
ou de la théorie générale, présente (comme d’ailleurs toute théorie physique) des 
difficultés conceptuelles d’abord et d’autres purement techniques, ensuite. 

Au niveau conceptuel, le principal problème consiste à «penser de manière 
relativiste», c’est-à-dire dans l’espace-temps *, notion absolument centrale. On 
pourrait croire que depuis 1908, date à laquelle il a été introduit, ce concept 
d’espace-temps, avec ses structures déterminées par le cône de lumière, est acquis 
dès les premières années d’université. Il n’en est malheureusement rien car, pour 
nombre d’étudiants (et souvent d’enseignants!) la Relativité Restreinte se limite à 
la transformation de Lorentz, à la contraction des longueurs et à la dilatation des 
durées! Il est clair, enfin, que l’apprentissage de la Relativité Générale présente, 
dans un premier temps, assez peu de difficultés conceptuelles pour qui maîtrise 
la Relativité Restreinte. C’est pourquoi cet ouvrage contient un exposé de cette 
théorie basé uniquement sur la notion d’espace-temps, notion introduite elle- 
même au niveau classique. Il est ensuite assez aisé de montrer, qualitativement, 
qu’en déformant le cône de lumière de la Relativité Restreinte, la gravitation rend 
pratiquement nécessaire l’introduction d’un espace-temps courbe. Si le principe 
d'équivalence — autre concept central de la Gravitation Relativiste — présente 
moins de difficulté dans ses versions les plus simples, auxquelles le lecteur peut se 
limiter dans un premier temps, il contient nombre de subtilités dont nous n’avons 
mentionné quelques-unes que pour mettre en évidence leur lien avec d'éventuels 
phénomènes géophysiques, astrophysiques ou autres, afin aussi que le lecteur ne 
soit pas confronté à un système théorique fermé mais garde présent à l’esprit que 
d’autres voies restent possibles. 

Au niveau technique, maintenant, si le calcul tensoriel dans l’espace de Min- 
kowski peut être maîtrisé assez facilement — à cette fin, les exercices sont indis- 
pensables — ce n’est pas tout à fait le cas de ce même calcul en espace courbe. 
Généralement, la conjonction de ce type de difficulté avec celles de nature concep- 
tuelle peut rendre difficile l’abord de la Gravitation Relativiste. C’est pourquoi 
l'usage des coordonnées curvilignes a été introduit en Relativité Restreinte °, lex- 
tension au cas d’un espace-temps courbe devenant alors très simple : il s’agit, à 
quelques détails près, des mêmes formules. 

Ajoutons que la matière de ce livre a été enseignée pendant plusieurs années à des 
niveaux très divers allant de la seconde année d’ université, dans ses aspects les plus 
simples, à la quatrième ou cinquième en l’adaptant, bien entendu, a ces différents 
publics. De cette diversité, il subsiste dans cet ouvrage une lecture possible à deux 
niveaux. 

Le premier niveau, élémentaire, permet d’ obtenir une vue générale du sujet et est 
surtout fondé sur des raisonnements intuitifs et sur une approche plutôt heuristique 
que technique. 


4. Voir E.F. Taylor, J.A. Wheeler (1966). 
5. A la suite de V.I. Fock (1966). 
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Le second niveau, tout en restant en deçà de ce qui est indispensable à une 
utilisation courante, exige un peu plus d’efforts car, si les concepts en jeu sont 
exposés avec leurs bases expérimentales et théoriques ainsi que leur articulation 
logique, il est également nécessaire de les étayer par des éléments techniques tout 
en restant au niveau des mathématiques usuelles. Ce second niveau, pour étre 
réellement acquis, exige le recours aux exercices proposés en fin de chapitre. Il a 
pour but une compréhension minimale, notamment pour ceux que |’ Astrophysique 
Relativiste intéresse, autorisant l’accès sans trop de difficultés à la littérature 
courante. Il est clair, cependant, que seuls des textes plus avancés (manuels ou 
articles originaux) peuvent permettre une certaine maîtrise du domaine. 

Ce second niveau se veut «ouvert» ainsi qu’il convient à un domaine en plein 
développement. C’est pourquoi le lecteur trouvera dans les références aussi bien 
les articles des «pères fondateurs » que des compléments divers sur tel ou tel point, 
sur des démonstrations non données dans le cours du texte; il trouvera aussi des 
indications expérimentales ou observationnelles dont le détail n’a pas sa place ici; 
il trouvera également des tentatives «iconoclastes»; il s’agira enfin de rendre à 
César ce qui lui appartient. En aucun cas les références ne sont (ni ne peuvent 
être) exhaustives : il s’agit d’un choix de nature purement pédagogique. 

Au niveau 1, le lecteur pourra se limiter à l’étude des parties suivantes du texte : 
chapitre 1 (complet); chapitre 2 (complet); chapitre 4 (complet); chapitre 6 (mani- 
festations de la courbure, courbure des surfaces à deux dimensions, signification de 
la courbure intrinsèque, arguments en faveur d’un espace-temps courbe); chapitre 7 
(le principe d’équivalence faible, le couplage minimal, lentilles gravitationnelles); 
chapitre 8 (début de la métrique de Schwarzschild). 

Au niveau 2, qui contient naturellement le niveau 1 et représente à peu près 
soixante heures d’enseignement, en y incluant les exercices, le lecteur devra étudier 
les divers éléments techniques présentés ainsi que leurs applications, et les conforter 
par les problèmes proposés, qui se rapportent aussi bien à des démonstrations 
simples non données dans le corps du texte qu’à des points purement techniques, 
voire à des illustrations ou des compléments divers. On pourra, sur tel ou tel point, 
consulter l’un des manuels de relativité indiqués ou même les articles originaux 
de la bibliographie. De manière générale, certains paragraphes en petits caractères 
peuvent être sautés en première lecture. 

A titre d'exemple, et pour nous limiter à des ouvrages publiés ces vingt dernières 
années, nous mentionnerons, par ordre de difficulté à peu près croissante et sans que 
la liste ci-dessous soit complète, les ouvrages suivants : J. Schwarz, M. McGuiness 
(1980); J. Foster, J.D. Nightingale (1979); M.G. Bowler (1976); B. Schutz (1988); 
N. Straumann (1984); S. Weinberg (1972); R. Wald (1984), etc. Ajoutons également 
deux ouvrages parus en français récemment : Ph. Tourrenc (1993); J. Leite-Lopes 
(1993). 

A ces ouvrages il pourra être utile d’ajouter le livre d’exercices de Lightman et 
al. (1975). En ce qui concerne le volumineux ouvrage de Ch. Misner, K. Thorne et 
J.A. Wheeler (1973), il convient, dans la perspective limitée adoptée ici, de l'utiliser 
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davantage comme une sorte de dictionnaire que comme un manuel à part entière; 
nous nous y référerons cependant à maintes reprises. 
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aussi, ont été extrêmement utiles. 


CHAPITRE 1 


La gravitation newtonienne 


Dans toute la physique classique, l’espace et le temps constituent l’arène où se 
déroulent les divers phénomènes de la Nature. Ceux-ci ne modifient aucunement ce 
cadre spatio-temporel qui, inerte, est fixé une fois pour toutes, de manière absolue. 
Bien plus, le temps et l’espace sont de natures totalement différentes et n’ont aucun 
lien entre eux. Aussi la relativité nous apparaîtra-t-elle comme une théorie de la 
liaison mutuelle de l’espace et du temps, qui trouvera son couronnement avec la 
Relativité Générale, laquelle lie les propriétés spatio-temporelles aux processus 
dynamiques qui s’y produisent. 


L’espace-temps newtonien 


L'espace physique possède les propriétés usuelles de continuité, d’homogénéité, 
d’isotropie qu’on attribue à l’espace R3, muni de sa structure affine (parallélisme, 
existence de droites) et de sa structure métrique habituelle (‘“théorème” de Pytha- 
gore). Il est cependant nécessaire de bien comprendre le sens physique des divers 
concepts mathématiques liés à R3. Ainsi l’existence d’objets ou de phénomènes 
physiques, représentables par des droites (mathématiques) provient de la notion 
(expérimentale) d’alignement : trois points sont alignés (physiquement) si l’on peut 
trouver un point de vue tel qu’ils apparaissent confondus. Il s’ensuit que si la lumière 
constitue notre étalon de rectitude, c’est seulement par un pas supplémentaire de 
la pensée (lequel peut se révéler incorrect) que l’on peut identifier la trajectoire 
d’un rayon lumineux avec une droite de R3. De même le concept mathématique 
de parallélisme dans R? est directement lié à la notion (physique) de transport 
rigide et à celle de distance. Enfin, il faut se rendre compte que les propriétés 
(mathématiques) d’homogénéité et d’isotropie de l’espace physique ne font que 
traduire des faits d'expérience concernant les systèmes mécaniques : l’inaltérabi- 
lité des systèmes matériels mis dans quelque position et lieu que ce soit. Dans tous 
les cas, nos idées théoriques proviennent exclusivement de propriétés vérifiées à 
une échelle locale. 

Le temps usuel est mathématisé par un simple paramètre réel et donc R 
représente le temps : R constitue l’élaboration quantitative de la notion qualitative 
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de changement. Physiquement, cela nécessite la connaissance d’un étalon du 
changement dont les états “successifs” (au sens intuitif) seront quantifiés de manière 
a définir une unité de temps. La principale caractéristique physique du temps est de 
s'écouler uniformément. Cela présuppose |’ existence d’étalons restant semblables 
à eux-mêmes au cours de leurs changements d’état successifs. Cette hypothèse 
est basée sur la constatation empirique que les diverses horloges conduisent à des 
mesures concordantes de l’écoulement du temps. Enfin, le fait que R soit totalement 
ordonné traduit, mathématiquement, la structure causale de la temporalité. 

Ces propriétés physiques de l’espace (isotropie, homogénéité) et du temps 
(uniformité) se traduisent mathématiquement par des invariances dans des groupes 
de transformation (rotations, translations d’espace et de temps) qui impliqueront 
l'existence d’intégrales premières (moment cinétique, impulsion et énergie) ou 
constantes du mouvement. 

Nous avons vu que, dans le cadre de la physique classique, l’espace et le 
temps étaient susceptibles d’être représentés mathématiquement par R? et R, 
respectivement. Il est alors parfaitement possible de construite un espace-temps 
classique (c’est-à-dire prérelativiste), à quatre dimensions, 


M = R**! = R°xR, (1.1) 


qui reste, à ce stade, une construction purement mathématique de peu d’utilité ou, 
tout au moins, sans base physique qui le rende nécessaire. 

En réalité, même les notions (prérelativistes) d’espace et de temps sont inti- 
mement liées. C’est ce que Minkowski affirmait déjà, dans son célèbre article de 
* 1908, de la manière suivante : “Les objets de notre perception impliquent invaria- 
blement temps et lieu ensemble. Personne n'a jamais observé de lieu sauf en un 
instant donné, ni de temps sauf en un endroit précis”. A cela, on peut d’ailleurs 
ajouter que la présence de matière est indispensable si l’on veut observer quoi que 
ce soit. .. Bien que le lien entre l’espace et le temps soit tout à fait manifeste dans 
le contexte relativiste, il existe également dans le cadre newtonien et c’est ce que 
nous allons étudier rapidement ci-dessous. 

Une discussion un peu approfondie [H. Reichenbach (1958); M. Bunge (1967)] 
du temps newtonien montre clairement déjà que le temps ne peut se concevoir sans 
un recours nécessaire à des notions spatiales. En outre, si nous avions analysé plus 
en détail les divers processus (idéaux) de mesure du temps, la liaison entre l’espace 
et le temps apparaitrait également. 

Dans le cas de l’espace physique, si l’on revient à la genèse de ses principales pro- 
priétés, on peut aussi constater l’existence de phénomènes temporels qui leur sont 
liés, quoique implicitement. Considérons, par exemple, le caractère euclidien de 
l’espace physique. Cette propriété provient, d’une part de la possibilité de dépla- 
cements rigides (éventuellement avec un mouvement rectiligne et uniforme) et, 
d’autre part, de l’analyse des processus de mesure de distance, lesquels impliquent 
soit le transport de règles rigides, soit, plus particulièrement, l’utilisation de signaux 
lumineux. Ce caractère euclidien de l’espace physique est donc basé implicitement 


L’espace-temps newtonien 3 


sur des faits utilisant la notion de temps, soit directement (mouvements divers), soit 
indirectement (propagation de signaux lumineux). Les autres propriétés de l’espace 
physique conduiraient à des conclusions semblables. 

Finalement, l’espace-temps classique R°+! apparaît comme physiquement 
beaucoup plus fondamental qu’il n’y paraît à première vue; aussi peut-on se poser 
la question de savoir si ses diverses structures mathématiques correspondent, ou 
non, à des aspects particuliers de la réalité. 


Figure 1.1 : L’espace-temps classique. // possède une structure en strates spatiales, euclidiennes (Ad 
est la distance entre deux points d'une même strate du même espace physique). Le temps est représenté 
par des droites qui coupent ces diverses strates. (1) représente la trajectoire d’une particule ayant un 
mouvement arbitraire dans l’espace-temps newtonien. 


Cette structure est décrite sur la figure 1.1. Le temps, universel et absolu, est 
représenté par des droites orientées (cette orientation est purement conventionnelle 
et n’est soumise qu’à une condition de cohérence minimale précisée plus loin) 
qui coupent chacun des 3-plans euclidiens représentant l’espace. A priori langle 
de ces droites avec les 3-plans spatiaux que l’on peut observer sur la figure est 
strictement sans aucune signification. En effet, R°*! ne possède pas de structure 
métrique euclidienne — contrairement au cas de la Relativité Restreinte ! — qui 
puisse donner un sens à la notion d’angle dans cet espace ?. C’est pourquoi toutes 
les droites du genre temps, c’est-à-dire non contenues dans un 3-plan spatial, 
constituent des axes de temps possibles, parfaitement équivalents. De même, |’ angle 
apparent formé par deux tels axes de temps, du moins sur la figure, n’a pas non plus 
de signification absolue : il n’est dû qu’à l’inadéquation de notre représentation 
d’un espace non euclidien, l’espace-temps classique, par un espace qui, lui, est 
euclidien, celui de la feuille de papier assimilée à R?. Enfin la structure en strates 
d'événements simultanés de R*+! doit être interprétée comme sa structure causale. 
Ainsi l’hyperplan de type spatial t( A), qui passe par l’événement À sépare l’espace- 
temps newtonien en deux régions : Je futur t > t(A), qui peur être influencé par les 
phénomènes susceptibles de se dérouler en À, et le passé t < ¢(A), qui peut avoir 


1. Pseudo—euclidienne, dans le cas de la Relativité Restreinte : voir le chapitre 2. 
2. Via un produit scalaire du type X.Y = |X||¥| cos 8. 
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été susceptible d’influencer A; la frontière entre le passé et le futur est le présent, 
c’est-à-dire l’hyperplan spatial (A) qui, lui aussi, peut influencer l’événement À 
en raison de l’existence possible, en physique newtonienne, d’actions à distance 
instantanées |Fig. 1.1]. 

Etudions maintenant les structures métriques de R3+! : chaque strate de type 
spatial possède une structure métrique euclidienne, la distance usuelle; de même, 
chaque fibre du genre temps possède également une métrique euclidienne, la durée. 
Par contre R3+! ne possède aucune structure euclidienne et, plus particulièrement, 
certainement pas celle de R4. 


En effet, pour qu’une distance euclidienne dans R* du type 


Ag? = Ax? + At? v2 


ait un sens, il faudrait que l’on pût disposer d’un paramètre vo absolu, universel, ayant les dimensions 
d’une vitesse et, évidemment, possédant un sens physique quelconque. 


Il reste enfin à se demander si les droites du genre temps qui nous ont servi d’axes 
temporels possibles ont un sens physique. C’est précisément le principe d'inertie, 
que nous étudions ci-après, qui permet de leur attribuer un tel sens qui, jusqu’ ici, 
leur fait défaut. 

En résumé, l’espace-temps newtonien possède quatre dimensions, une structure 
causale déterminée par des objets géométriques qui lui sont propres (les 3-plans 
spatiaux et les droites temporelles, toutes orientées de la même manière) et des 
structures affine et métrique assez complexes. Une classe d’objets géométriques, les 
droites du genre temps — elles représentent des mouvements possibles de particules 
libres — renforce encore la liaison entre l’espace et le temps. Nous verrons au 
chapitre 2 quelles structures subsistent en Relativité Restreinte et quelles sont celles 
qui sont modifiées et comment. 


Simultanéité et mesure des distances 


Dans l’analyse de l’espace-temps classique qui précède, nous avons considéré 
comme allant de soi la simultanéité d'événements. Cela correspond-il réellement 
à ce qui est effectivement mesurable, du moins en principe? N’y a-t-il pas là 
d’hypothèse implicite allant au-delà de ce que l’on peut directement tirer de 
l analyse des processus expérimentaux possibles, même idéalisés ? Examinons cela 
de plus près °. 

Pour cela 4, commençons par remarquer que la notion de simultanéité en un 
point d’espace n’a pratiquement pas de sens concret (elle ne peut guère être 
réalisée approximativement que dans le cas de collisions de particules élémentaires) 


3. En outre, la critique de la notion de simultanéité classique constitue un élément important dans la 
genèse de la Relativité Restreinte par Einstein. 


4. Nous suivrons ici exposé de H. Reichenbach (1927). 
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et constitue, au mieux, une identité logique, c’est-à-dire une définition d’un 
événement spatio-temporel. Le cas réellement important est celui concernant la 
simultanéité d'événements spatialement distincts. 

Il est alors aisé de se rendre compte que la comparaison temporelle d'événements 
distants n’est possible que parce qu’un signal est envoyé d’un lieu à un autre, signal 
qui permet la synchronisation d’horloges situées en ces deux endroits. Pour effectuer 
cette comparaison, il nous faut connaître d’une part la distance spatiale des deux 
événements et, d’autre part, la vitesse du signal. 


Comment mesurer cette vitesse? Si P; et P2 désignent les deux points d’ espace, si t, et t2 désignent 
les temps de départ et d’arrivée du signal, on aura alors 


Pi P2 
X tg = ti 
Mais, pour que cette dernière expression ait un sens, il faut bien que les horloges situées en P} 
et P2 aient été préalablement synchronisées! Apparemment, l expérience de Fizeau concernant la 
mesure de la vitesse de la lumière [Fig. 1.2] ne requiert qu’une seule horloge : au temps t, un signal 
lumineux est envoyé vers un miroir situé à une distance £ où il est réfléchi au temps tz vers son point 
de départ où il arrive au temps tz; on a alors 


_  2e 
~ tg — ty : 
et le temps t2 n'apparaît jamais ... 
c, 
——> 
P, P; 
OREP EPESA EE EE E — 
c. 


Figure 1.2 : Mesure de la vitesse de la lumière (Fizeau). Un signal lumineux émis en P) au temps ti 
est réfléchi en P2 et revient en P1 au temps t3; ce faisant, on ne mesure que la moyenne des vitesses 
dans les sens P, Pz et P2 P}. La mesure de tı et celle du temps d’arrivée t2 en P2 nécessitent une 
synchronisation préalable de deux horloges, l’une en P, et lautre en P3, et donc l'envoi d’un signal 
lumineux entre ces deux points. . . dont on doit connaître la vitesse de propagation à l'avance! En réalité, 
la physique newtonienne admet la synchronisation des horloges par transport lent, voire à l’aide de 
signaux qui se propagent à vitesse infinie. 


En réalité, l'expérience de Fizeau ne permet de mesurer que la moyenne harmonique des vitesses 
cı €t cg de la lumière allant au miroir et en revenant : 


Aussi l’usage d’une seule horloge est-il “payé” par l'hypothèse supplémentaire c1=e2. Si l’on 
souhaite vérifier expérimentalement cette hypothèse, alors il faut effectivement disposer de deux 
horloges, en deux points différents, et qui ont donc dû être synchronisées préalablement [Fig. 1.3]. 
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Figure 1.3 : La mesure de la vitesse de la lumière (Fizeau) telle qu’elle se présente dans l’espace- 
temps. C et B sont simultanés mais C est arbitraire (avec, cependant, tı < t3 < ta), car ta dépend 
de la façon dont la simultanéité a été définie. 


Nous avons donc abouti au cercle vicieux suivant : la simultanéité nécessite la 
connaissance d’une vitesse, laquelle, à son tour, exige que soit établie la simultanéité 
de deux événements! 

Il n’y a pas là, en fait, de contradiction : c’est que la simultanéité n’est pas 
essentiellement une question expérimentale; il s'agit aussi d’une question de 
définition qui, comme toute définition, contient une part d’arbitraire. 


Ainsi, dans l'expérience de Fizeau, l’instant d’arrivée du rayon lumineux sur le miroir sera, par 
définition, 


to =t) + 4 (t3-t1) . 
Toutefois, on aurait pu aussi bien adopter la définition 


y= fi +e(t3—th) . 


avec 0<e<1; et cela, sans aucune contradiction [H. Reichenbach (1927)]. 


En pratique, les signaux lumineux, étant les plus rapides connus, sont utilisés 
pour définir la simultanéité. Ainsi, pour reprendre la définition d’Einstein de la 
simultanéité physique, deux événements se produisant en deux points distants A 
et B seront simultanés si des signaux lumineux de A et de B arrivent au méme 
moment au milieu M du segment AB. 

La où les choses se compliquent, c’est lorsqu’il s’agit d’établir la simultanéité 
de deux événements dans un repère en mouvement relativement à un autre repère : 
une paire d’événements, simultanés dans un système de référence, ne le sont plus 
dans le second (en mouvement) [Fig. 1.4]. 


La figure 1.4 (a) montre que les événements A et B sont simultanés pour M. Sur la figure 1.4 (b), 
on a indiqué les trajectoires des points À et B, respectivement; un observateur en mouvement par 
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espace espace espace 


(a) (b) (c) 


Figure 1.4 : Relativité de la simultanéité (considérée ici dans l’espace-temps newtonien). La figure 
(a) illustre la simultanéité d'événements distants A et B : un observateur K, au repos par rapport à la 
règle, considérera comme simultanés uniquement les points dont lui parviennent, au même instant, les 
rayons lumineux issus des extrémités (trajectoires d'espace-temps représentées par des lignes verticales 
continues). La figure (b) indique quels sont les événements simultanés pour l'observateur K’ (trajectoire 
d'espace-temps oblique sur la figure) en mouvement rectiligne et uniforme par rapport à K, compte 
tenu de la définition illustrée en (a). Enfin, la figure (c) constitue la superposition des cas (a) et (b) et 
montre clairement que des événements simultanés pour M (tels A et B) ne le sont plus pour M’ (tels 
A et B’). 


rapport à K décrit la trajectoire désignée par K’. En M” lui parviennent les signaux lumineux de 
deux points A et B qui ne sont manifestement pas simultanés dans K. La figure 1.4 (c) montre 
les deux situations à la fois : deux événements simultanés pour M, dans K, (c’est-à-dire A et B), 
apparaissent comme non simultanés dans K”, et réciproquement. 


Venons-en maintenant à la mesure des distances. Pour mesurer une longueur, 
il suffit de déplacer un certain nombre de fois une règle rigide : le processus de 
mesure prend alors un certain temps [Fig. 1.5] que l’on peut, dans le cadre classique, 
réduire arbitrairement. Cependant, lorsque l’objet à mesurer est en mouvement, 
par rapport à un système de référence K, ce procédé n’est pas simple à mettre 
en pratique. Mais, détail beaucoup plus important, il est nécessaire de mesurer 
les distances spatiales d'événements physiquement simultanés. Or la simultanéité 
physique étant une notion essentiellement relative, il en sera de même de la mesure 
des distances [Fig. 1.6]. 


Les absolus de Newton et la notion d’éther 


L'espace et le temps classiques, dont nous avons indiqué plus haut les principales 
propriétés, ne font apparaître nulle part de notion d’éther ° et sont relatifs à des paires 
d'événements : le mouvement d’un système mécanique ne peut être repéré que 
par référence à un autre système matériel. Et, en réalité, ce point de vue “relatif” 
~ dû à Ernst Mach - correspond très exactement aux processus de mesures et 
d’ observations qui, effectivement, conduisent à nos concepts modernes d’espace et 
de temps. 


5. La notion d’éther date du XIX® siècle et est due, semble-t-il, à J.C. Maxwell. 
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temps 


distance & mesurer 
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espace 


Figure 1.5 : Mesure d’une distance à l’aide d’une règle rigide. Chaque déplacement de la règle 
(rigide) le long de l'objet à mesurer prend a priori un certain temps pour être réalisé. Toutefois, 
en physique prérelativiste, la durée de chaque mesure peut — du moins en principe — être réduite 
arbitrairement. 


espace 


Figure 1.6 : Relativité des mesures des distances. Dans son système propre, l'observateur K’ mesurera 
la distance A’ B'; par contre, l'observateur K mesurera AB # A'B. 


Newton, par contre, a un point de vue fort différent dans lequel l’espace et 
le temps sont absolus, existent donc par eux-mêmes indépendamment des objets 
matériels qu’ ils contiennent. Il distingue ainsi des mouvements relatifs — ceux que, 
précisément, on observe — et des mouvements absolus, qui s’effectuent relativement 
à l’espace absolu et à une échelle de temps absolue. Pour lui, l’espace relatif (de 
même que le temps relatif) n’est qu’une mesure de l’espace absolu (du temps 
absolu). Voici ce qu’en dit Newton : 

... “L'espace absolu, sans relation aux choses extérieures, demeure toujours similaire et immobile. 

L'espace relatif est cette mesure, cette dimension mobile, des espaces absolus : que nos sens 

déterminent par sa position aux corps; et qui est communément prise pour l’espace immobile”... 

... “Le temps absolu, vrai et mathématique, sans relation à rien d'extérieur, coule uniformément 

et s'appelle durée”... 

. . “Un mouvement absolu est le déplacement d'un corps d'un lieu absolu à un autre lieu absolu; et 


le mouvement relatif [concerne] le déplacement d’un lieu relatif à un autre”. . . [cité par M. Jammer 
(1954); reproduit avec l’aimable autorisation de l'éditeur]. 
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L'existence d’un temps et d’un espace absolus, même indécelable par des moyens 
mécaniques, est en fait une nécessité à la fois d’ordre logique et aussi d’ordre 
ontologique pour la validité du principe d’inertie, du moins pour Newton. Si, en 
effet, l’état de repos présuppose l’existence d’un espace absolu, l’exigence qu’un 
système d’inertie ne soit pas une pure fiction mais puisse être conçu, fût-ce à titre de 
concept, et utilisé réellement implique nécessairement le temps et l’espace absolus. 

Nous verrons un peu plus loin que tous les systèmes d’inertie se déduisent les 
uns des autres à l’aide des transformations de Galilée. Pour Newton, un seul d’entre 
eux est réellement immobile, de manière absolue; mais comment le distinguer des 
autres ? “Que le Centre du Monde soit immobile; cela est reconnu par tous, tandis 
que certains prétendent que la Terre, et d'autres, le Soleil, est fixe en ce centre.” En 
fait, Newton place ce “Centre du Monde” au centre de gravité du système solaire ®, 
ce qui est en dehors de toute vérification, quelle qu’elle soit. 

Par la suite, de nombreux philosophes (Leibniz, Huyghens, etc.) s’opposèrent 
aux absolus de Newton car, comme il le reconnaissait lui-même, l’espace et le 
temps absolus “ne tombent effectivement jamais sous l'observation de nos sens”. 
Néanmoins, pour des raisons d’ordre théologique” [“Newton identifie espace 
et temps avec des attributs divins, Dieu n'est pas éternité et infinité, mais est 
éternel et infini. Eternel et omniprésent, Dieu constitue durée et espace” {Max 
Jammer (1954)}], et malgré les objections de Leibniz et Huyghens, les absolus de 
Newton furent salués comme un accomplissement remarquable de la “philosophie 
naturelle”, c’est-à-dire de la science. 

Cependant, le développement de la mécanique au XVIIÉ siècle (Lagrange, 
Laplace, Poisson) montrait que les absolus de Newton ne jouaient qu’un rôle très 
faibie, pour ne pas dire inexistant, dans la description et la prévision de phénomènes 
naturels. Ii devint ainsi progressivement clair que, dans la pratique, l’on pouvait 
s’en dispenser. Voici ce qu’en dit J.C. Maxwell, par exemple : 


“ L'espace absolu est conçu comme restant toujours semblable à lui-même et immobile. L’arran- 
gement des parties de l’espace ne peut pas plus être altéré que l'ordre de portions de temps. Les 
concevoir comme se mouvant de leurs lieux revient à concevoir le mouvement d’un endroit lui-même. 
Mais de la même façon que rien ne distingue une portion de temps d'une autre excepté les différents 
événements qui s’y déroulent, il n’y a rien qui distingue une partie de l’espace d’une autre sauf sa 
relation avec le lieu d'un corps matériel. Nous ne pouvons pas décrire le temps d'un événement sauf 
par référence à quelque autre événement, ou le lieu d’un corps sauf par référence à un autre corps. 
Toute notre connaissance, à la fois du temps et de l’espace, est essentiellement relative” [cité par 
M. Jammer (1954)]. 


A la fin du XIX® siècle, il devint tout à fait clair que la notion d’espace absolu 
échappait complètement à toute possibilité d’observation [voir, plus loin, le principe 
de relativité galiléen]; notamment l’idée que l’espace absolu agit par lui-même mais 
ne peut subir d’action qui le modifie (E. Mach). 


6. Quoique Halley ait annoncé en 1718 que certaines étoiles considérées jusqu'alors comme fixes 
(Sirius, Aldébaran, Bételgeuse) avaient changé de position depuis Ptolémée, Newton ne tient pas compte 
du mouvement possible du système solaire (imaginé auparavant par Giordano Bruno) qui le rend inapte 
au rôle de “centre du monde”... 

7. La preuve dite ontologique de l'existence de Dieu et les autres preuves traditionnelles commençaient 
à être considérées comme logiquement déficientes. 
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Ace stade, il ne restait qu’ une possibilité réelle de mise en évidence d’un espace 
absolu, d’un éther. En effet, avec les découvertes (i) du caractère fini de la vitesse de 
la lumière et (ii) de sa nature ondulatoire, il semblait certain qu’un milieu matériel, 
l’éther, dernier avatar de l’espace absolu, était indispensable en tant que support à la 
propagation des ondes électromagnétiques. Mais, nous le verrons plus loin, même 
cette possibilité sera exclue par l’expérience, celle de Michelson et bien d’autres 
encore. 


Le principe d’inertie 


Dans de nombreux ouvrages de mécanique, on commence par énoncer les trois 
lois de Newton ê et, en premier lieu, le principe d’inertie ° sous la forme “un corps 
qui n'est soumis à aucune force est soit au repos, soit en mouvement rectiligne 
et uniforme”, où sous une forme semblable. Il s’ensuit que ce principe d’inertie 
paraît bien être la conséquence immédiate de la seconde loi de Newton, lorsqu’on 
y a annulé la force! En fait, le principe d’inertie possède un contenu nettement 
moins trivial, indépendant de la loi fondamentale de la dynamique, que nous allons 
considérer maintenant. 

Loin de constater une banalité ou même une pétition de principe, le principe 
d'inertie affirme, en réalité, l'existence de mouvements privilégiés, les mouvements 
“libres” ou mouvements inertiels. Ces mouvements correspondent alors à toutes les 
trajectoires rectilignes possibles dans R?, parcourues uniformément dans le temps. 
Il n’est peutêtre pas inutile de souligner l’apport révolutionnaire de ce principe : 
alors que pour les penseurs médiévaux (Buridan, par exemple, au XIV® siècle) et 
leurs successeurs, le mouvement inertiel est le résultat d’une qualité intrinsèque du 
mobile, tout au contraire, pour Newton (et pour ses prédécesseurs qui ont peu à peu 
découvert le principe d’inertie 1°) [M.A. Tonnelat (1971) ou M. Jammer (1961)], 
ce type de mouvement est, d’une part, équivalent à l’état de repos, et d’ autre part, 
n’est engendré ou arrêté par une action extérieure qu’en son début ou en sa fin, 
respectivement. 

Dans le cadre de l’espace-temps classique, le principe d'inertie se traduit par le 
fait que la structure affine discutée auparavant représente effectivement une réalité 


8. C'est-à-dire : (i) le principe d’inertie; (ii) la loi fondamentale de la dynamique et (iii) l'égalité de 

l’action et de la réaction. 
9. La formulation de Newton est la suivante : “Tout corps persiste dans son état de repos ou de 
mouvement rectiligne et uniforme à moins qu'il ne soit amené à changer cet état par des forces qui lui 
soient imposées.” 
10. La définition que nous donnons ici est de nature cinématique. Il est également possible de donner 
une définition de caractère dynamique du principe d’inertie; cependant, elle présente l'inconvénient de 
rendre beaucoup plus délicate la discussion des concepts liés à l’espace-temps classique, car celui—ci 
contient alors un élément dynamique qui n’a pas véritablement de justification très évidente dans le cadre 
newtonien. Ainsi, on peut définir un repère galiléen comme un repère dans lequel la loi fondamentale 
de la dynamique s’écrit sous la forme habituelle Fm. 
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physique : les droites du genre temps — donc non contenues dans des 3-plans 
spatiaux ¢ = const. — correspondent à des mouvements physiquement réalisables, ou 
plutôt concevables comme limites ou comme idéalisations de mouvements réels, les 
mouvements de particules “libres”. Bien entendu, la notion de mouvement “libre” 
est une abstraction qui reflète cependant, dans des limites qui dépendent de l’échelle 
des systèmes considérés, une certaine réalité. 

Cette classe de mouvements privilégiés est donc définie intrinsèquement dans 
l’espace-temps : ce sont les droites du genre temps, donc des objets géométriques 
de R3+1, indépendants de tout système de coordonnées, indépendants aussi 
de la nature des “horloges” utilisées pour mesurer le temps et des “règles” 
qui permettent la détermination des distances. C’est seulement l’introduction de 
l’espace-temps classique qui permet la caractérisation géométrique, intrinsèque 
donc, des mouvements inertiels. Inversement, c’est l’existence de cette classe de 
mouvements, ou tout au moins la reconnaissance de leur importance, qui fonde 
assez largement le concept d’espace-temps. 

Pratiquement, l’existence des mouvements inertiels se traduit par celle de 
systèmes de référence inertiels, ou encore systèmes de référence galiléens, c’est- 
à-dire la donnée d’échelles de temps où celui-ci s'écoule uniformément et 
de coordonnées cartésiennes dans R° (également d’ailleurs dans R3+!, où les 
mouvements “libres” s’effectuent en lignes droites; de plus, à ces coordonnées 
cartésiennes, on peut toujours associer un système physique en mouvement “libre’’). 

Il est clair qu’un événement quelconque de l’espace-temps classique R°+1 
peut être repéré à l’aide de systèmes de coordonnées arbitraires. Toutefois, la 
possibilité de le faire à l’aide de coordonnées cartésiennes d’une part, et le fait 
que ces coordonnées aient un sens physique (mouvements “libres” convenables, 
associés), constituent un postulat, précisément le principe d’inertie. 

Les mouvements inertiels déterminent donc des systèmes de coordonnées 
canoniques dans R+! et, en tout point, existe une classe de repères (c'est-à- 
dire de vecteurs indépendants) déterminés par la classe de coordonnées galiléennes 
considérées : ce sont les repères d’inertie ou repères galiléens. Ces repères serviront 
de bases pour déterminer analytiquement les champs de vecteurs utilisés, les 
vitesses, les accélérations, les forces, etc. 

Etant données des coordonnées galiléennes !! (x, t), il est facile de se rendre 
compte que l’on peut en déduire une infinité d’autres à l’aide des relations 

x’ = Rx — vt + xo 
{ t =t+ to 
où R est une rotation arbitraire, v une vitesse arbitraire également, xp un vecteur 
de R? quelconque et tp une durée quelconque. Ces transformations, les transfor- 
mations de Galilée, étant linéaires vont transformer une droite de R°+! en une 


(1.2) 


11. En fait, ce qui suit concerne plutôt le cas de repères galiléens. Cependant, comme nous utiliserons 
des coordonnées cartésiennes (x,t), nous parlerons indifféremment de repères ou de coordonnées 
galiléennes (ou repères inertiels), ce qui, à proprement parler, constitue un abus de langage courant. 
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droite de R3+! : un mouvement inertiel est transformé en un mouvement inertiel. 
Elles entérinent le fait que l’espace est isotrope : si v = 0, x» = 0 et to = 0, 
la rotation d’une droite de R fournit une autre droite! Il en est de même pour 
Vhomogénéité spatiale. Ces transformations forment un groupe continu à dix pa- 
ramètres (trois pour les rotations, trois pour les translations spatiales, trois pour les 
transformations de Galilée pures — ou restreintes — 


=x — vt (1.3) 


A t, 


et une enfin concernant les translations de l’origine du temps) dont les propriétés 
se traduisent aisément dans le domaine physique. 
A ces transformations, on peut adjoindre les changements d’unités 


x’ = ax, t = ft, (1.4) 


ainsi que les retournements d’axes (parité) et le renversement du temps 
/ 1 
x -x,t =t 
1.5 
{ ! =x, = -t (1.5) 


qui ne modifient pas non plus le caractère inertiel du mouvement libre. 

A ce stade une question légitime se pose : existe-t-il dans la Nature des 
systèmes véritablement inertiels? A l'échelle du laboratoire, les mouvements 
“libres” horizontaux constituent à peu près des mouvements inertiels, si l’on néglige 
les frottements, par exemple. Un meilleur système inertiel que celui du laboratoire 
est lié au mouvement de translation de la Terre sur son orbite autour du Soleil. Mais 
là encore, il s’agit d’une approximation valable uniquement pour des échelles de 
temps courtes : si la valeur absolue de la vitesse moyenne de la Terre sur son orbite 
solaire est de 29 km/s, elle varie cependant un peu (de l’ordre de quelques km/s) 
de sorte que la Terre ne constitue pas un véritable système d’inertie. A son tour, un 
repère lié au centre de gravité du système solaire (donc, en pratique, au Soleil) peut 
constituer une bonne approximation d’un repére galiléen. 


Il 


4 
| 


Incidemment, l’adoption d’un système de coordonnées géocentrique (système de Ptolémée) ou 
héliocentrique (système de Copernic) est indifférent du point de vue mathématique. Néanmoins, 
un système héliocentrique rend les calculs analytiques du mouvement des planètes beaucoup plus 
simples. En outre, le système de Copernic constitue, physiquement, un meilleur système d'inertie. 
Cependant, la mauvaise querelle [E. Namer (1975)] cherchée aux coperniciens (dont Galilée est 
l’exemple le plus connu) trouve ses origines lointaines dans les conceptions cosmiques de Platon 
{A. Koestler (1960)] et est de nature philosophico-religieuse : il n’y a pas eu de querelle sur le choix 
d’un système d’inertie! 


Mais le Soleil — dont la vitesse est de l’ordre de 220 km/s par rapport aux étoiles 
fixes — participe de la rotation générale de notre galaxie, la Voie lactée (une galaxie 
spirale typique), et se trouve, en outre, soumis à l'attraction gravitationnelle des 
autres étoiles qui la constitue : ce n’est donc pas véritablement un système d’inertie. 
De même, notre galaxie ne constitue pas, elle non plus, un système inertiel : elle 
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est située dans un amas local, constitué d’une vingtaine d’autres galaxies à l’action 
desquelles elle est soumise; aussi son mouvement ne saurait-il être (et il n’est) 
ni rectiligne, ni uniforme. Toutefois, cette hiérarchie de systèmes de plus en plus 
proches d’un système inertiel ne s’arrête pas là; l’amas local fait partie de l’amas de 
galaxies de la Vierge en mouvement lui-même dans le superamas de la Vierge ... 

On pourrait donc concevoir que la considération d’objets de plus en plus 
lointains, dont on ne puisse observer les mouvements propres, permettrait d’ obtenir 
une approximation de plus en plus valable d’un système inertiel, concept théorique 
et, partant, idéal. Ainsi, on pourrait considérer qu’un “bon” repère inertiel puisse 
être constitué par le système solaire et trois quasars, objets relativement ponctuels 
(vus de la Terre) qui sont les plus lointains que l’on connaisse actuellement. 

Il doit rester clair qu’il ne peut exister dans la Nature de véritable système 
d'inertie; encore une fois, il s’agit d’un concept théorique dont la principale 
vertu réside dans la possibilité qu’il permet d’aller au-delà des aspects purement 
cinématiques, de la simple description de systèmes physiques; c’est-à-dire d’en 
étudier la dynamique. C’est d’ailleurs précisément parce qu’il n’y a, et ne saurait y 
avoir, de système véritablement isolé, que le concept de système d’inertie a été si 
difficile et si long à se dégager d’idées a priori. Ajoutons encore que la présentation 
cinématique — c’est-à-dire en termes d’espace et de temps du principe d’inertie 
donnée plus haut est évidemment une simplification car ce principe ne peut acquérir 
tout son sens que dans un contexte dynamique, où les notions de force, de masse, 
etc, sont élaborées. 

Une dernière remarque de nature théorique. Il pourrait s’avérer intéressant de 
se donner, mathématiquement, un espace-temps, c’est-à-dire une variété assez 
largement arbitraire, et un groupe d’invariance qui, y opérant transitivement, 
définirait alors une classe de mouvements, inertiels par définition (ainsi, R°*? et le 
groupe de Galilée). Bien qu’une telle idée suggère des généralisations, possibles sur 
le plan mathématique ou théorique, elle ne correspond pas à la démarche effectuée 
historiquement. 


Les lois de la dynamique et la relativité galiléenne 


Une fois définis les repères galiléens (ou les systèmes de référence galiléens, 
les coordonnées galiléennes) d’abord physiquement, puis conceptuellement et 
enfin mathématiquement, il est possible d’étudier non seulement les propriétés 
du mouvement de chaque système mécanique (cinématique) mais encore d’écrire 
des lois dynamiques !?, valables dans ces repères inertiels. 


12. C'est-à-dire de lois générales qui permettent d’aller au-delà de la seule description cinématique, 
en “résumant” des classes de mouvements ayant une même cause. 
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Ii sera donc possible, dans un tel repére, d’écrire la loi fondamentale de la 
dynamique (seconde loi de Newton) sous la forme 


2 
Fan (1.6) 


où F est la force appliquée à une particule de masse m située en x au temps t. 


En fait, Newton n’a pas écrit sa seconde loi sous la forme précédente mais plutôt sous une forme 
qui, en notations modernes, s’écrirait 


Fdt =dp 
P =mv, 
où p est l'impulsion de la particule. Cette dernière forme, qui provient, entre autres, de l’analyse 
faite auparavant par Huyghens, Marci, Wallis, Wren du choc des particules (où l’on a conservation 


de l’impulsion totale au cours du choc) subsistera en Relativité Restreinte, et non pas la précédente, 
avec toutefois cette différence que la relation entre impulsion et vitesse sera modifiée. 


La loi fondamentale de la dynamique newtonienne constitue un postulat qui 
nécessite, répétons—le, la loi d’inertie avant de pouvoir être formulé analytiquement. 
Elle recouvre une grande richesse de concepts qui ont exigé beaucoup d’efforts, de 
temps, de discussions pour émerger, et n’est en aucune façon triviale même si sa 
formulation mathématique est très simple 13. Aussi un rapide commentaire n’est-il 
pas totalement inutile. 

D'abord, cette loi relie deux concepts de natures différentes; l’une est cinéma- 
tique (l'accélération y) et l’autre dynamique (la force F). Cela constitue déjà une 
révolution car, jusqu’à Newton et depuis Aristote, la force était génératrice de vi- 
tesse et non pas d’accélération. 


Si l’on essayait d’écrire une loi dynamique correspondant aux conceptions mécaniques prénewto- 
niennes, i.e. scolastiques, on écrirait à peu près une équation du genre 


Fov 


Ceci n’était pas spécialement absurde : Aristote, observant des pêcheurs traînant une barque pouvait 
en inférer une loi de ce type, la force de frottement étant naturellement proportionnelle à la vitesse 
(à vitesse faible!). Ce genre de concepts devait empêcher — avec aussi l’absence de techniques 
mathématiques suffisamment élaborées — Kepler de parvenir à la loi de la gravitation universelle 
(voir plus loin), bien qu’il eût en main tous les éléments nécessaires pour y arriver (les trois lois qui 
portent son nom). 


Dans l’équation de la dynamique, la masse d’inertie m apparaît comme le 
coefficient de la réponse (l’accélération) à une excitation extérieure (la force). 
Elle caractérise bien la résistance au mouvement de la particule, une propriété 
intrinsèque, caractéristique de son contenu de matière : plus un corps est massif 
et plus il est nécessaire de déployer une force importante pour l’amener à se 
mouvoir à une vitesse donnée. Là encore le concept d'inertie a mis beaucoup de 
temps (plusieurs siècles) avant de pouvoir être dégagé [Max Jammer (1961)] : des 
premières analyses de Buridan (XIV¢ siècle) au concept qualitatif d’ inertie de Kepler, 


13. Encore fallait-il avoir inventé le calcul infinitésimal : Leibniz, Newton, .. . 
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aux expériences mentionnées sur les chocs de particules et à celles d’ Huyghens sur 
la force centrifuge, le chemin a été long jusqu’à la systématisation et l’élaboration 
extraordinairement complexes de Newton. 


La proportionnalité entre force et accélération d’une particule pourrait être différente de la forme 
usuelle F = my. Plus spécifiquement, on pourrait écrire, en se limitant à une relation linéaire, 


Fi = Ñ mij (ij = 1,2,3). (1.7) 
j 


Toutefois, le tenseur mt j, S'il n’était pas proportionnel à 6° ;, briserait l’invariance par rotation de 
l'espace : les deux ou trois vecteurs propres de m° ; introduiraient des directions privilégiées dans 
l’espace physique et celui-ci ne serait donc plus isotrope. I] n’en reste pas moins que l’existence 
éventuelle d’un tenseur de masse mi jm & j (6 j est le symbole de Kronecker qui vaut 1 si 
i = j et O autrement) doit être tranchée par l'expérience. Ceci a été fait [Chap. 3] et le résultat est que 
mi j= mô’ j etce, à une très bonne approximation : c’est l’expérience de V.W. Hughes et al. (1960), 
R.W.P. Drever (1961); voir aussi R.H. Dicke (1965). En raison de son importance théorique — qui 
va bien au-delà de l’anisotropie de la masse [C.M. Will (1981)} — indiquons brièvement sur quoi est 
basée cette expérience en citant S. Weinberg (1972) : Hughes et al. et Drever, indépendamment, “ont 
observé l'absorption résonante de photons par un noyau de Li” dans un champ magnétique de 4700 
Gauss. L'état fondamental a un spin 3/2 de sorte que, dans un champ magnétique, il se décompose 
en quatre niveaux d'énergie qui devraient être également espacés si les lois de la physique nucléaire 
possèdent une invariance de rotation. Dans ce cas les trois transitions entre états voisins devraient 
avoir la même énergie et le coefficient d'absorption des photons présenterait un pic aigu unique à 
cette énergie. Par contre, si l’inertie était anisotrope, alors les sous—états magnétiques ne seraient 
pas également espacés et il n’y aurait, non pas une seule, mais trois raies de résonances, proches” 
(reproduit avec l’aimable autorisation de John Wiley and Sons, Inc., copyright ©) 1972). Tel est le 
principe de cette expérience, répétée ensuite de nombreuses fois avec des matériaux différents. Le 
résultat de Hughes et Drever était Am/m<10~?° et a été beaucoup amélioré par la suite. Ce résultat 
peut être interprété de diverses manières [C.M. Will (1981); R.H. Dicke (1965)] et, en particulier, 
comme un test de haute précision de l’invariance de Lorentz locale. 


Enfin la notion de force elle-même appelle quelques remarques. 

D'abord, si l’on souhaite que seules les positions et les vitesses initiales de 
la particule en déterminent complètement le mouvement, il est nécessaire que F 
dépende seulement de x (la position de la particule au temps t), de v (sa vitesse au 
temps t) et, à la rigueur, du temps. On obtiendra alors un système différentiel du 
second ordre. Si F dépendait, par exemple, de y = (d/dt)v, il faudrait connaître 
également l’accélération initiale. 

Ensuite F est un vecteur de R3, ce qui semble clair puisque l’on exige sa 
proportionnalité à my. Cependant, même cette propriété n’est pas évidente : il 
fallait, préalablement à l’écriture de la loi de la dynamique classique, avoir reconnu 
et testé expérimentalement ce caractère vectoriel. Nous reviendrons plus loin sur 
d’autres caractères importants de la force newtonienne, notamment en relation avec 
le principe de relativité galiléen et la gravitation. 

Venons-en maintenant au principe de relativité galiléen. Considérons, pour 
cela, un système mécanique constitué de N particules ponctuelles de masses 
mi (i = 1,2,...,N) en interactions mutuelles par l'intermédiaire de forces à 
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deux corps du type 
F (ij) (Xi — Xj) , 


de sorte que, dans un système d’inertie, les équations du mouvement de la i-éme 
particule s’écrivent 


Mi ek = SF x;) | = 1,2,...,N. (1.8) 


Comment s’écrivent maintenant les équations du mouvement de ce systéme 
mécanique dans un autre systéme d’inertie? Pour le voir, effectuons une transfor- 
mation de Galilée; la ième particule est maintenant repérée à l’aide de coordonnées 
(xi, t) et l'équation précédente s’écrit 


dx; ys 
Mi a? = >», Fi) (x = x) (1.9) 
où nous nous sommes limités, quoique ce ne soit pas essentiel, à des transformations 
de Galilée “pures”. Cette nouvelle équation est formellement identique à la 
première! Autrement dit, le système mécanique considéré est décrit de la même 
manière, par des équations analogues dans tous les systèmes de référence galiléens. 
Plus concrètement, cela se traduit par le fait que le mouvement rectiligne et uniforme 
ne conduit à aucune modification décelable des propriétés mécaniques du système 
considéré : ce mouvement ne donne, en effet, pas lieu à des forces fictives (telle 
la force centrifuge dans le cas d’un mouvement de rotation) supplémentaires, qui 
donneraient donc naissance à des effets observables. C’est ce que Galilée exprimait 
en affirmant que “le mouvement est comme rien”. 
Notons que nous avons admis implicitement l’invariance des masses m; des 
particules dans une transformation du groupe de Galilée : 


En fait, si l’on considère que la masse — mesure de la résistance au changement 
dans le mouvement — est une propriété intrinsèque de la particule (par exemple, son 
contenu de matière), alors il doit bien en être ainsi. 

Nous sommes maintenant en mesure d’énoncer le principe de relativité galiléen. 
Comme le remarque fort justement M.A. Tonnelat (1971), il comporte deux 
aspects : l’un physique et l’autre descriptif. Son contenu physique est le suivant : le 
mouvement inertiel d’un système mécanique ne produit sur celui-ci aucun effet qui 
en modifie les propriétés mécaniques. Ce qui se traduit analytiquement par l’énoncé 
descriptif suivant : un système mécanique est décrit par des lois qui ont la même 
forme dans tous les systèmes de référence galiléens. 


Supposons, en effet, que les lois de la mécanique aient deux formes différentes dans deux systèmes 
de référence galiléens distincts; soit 


F = my, 
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dans le premier système et 


F = my +K, 


dans le second, où F’ est la transformée de F dans une transformation de Galilée quelconque. Le 
terme K supplémentaire traduirait alors cette non-invariance formelle des équations de la mécanique 
et, comme il est assimilable à une force, il donnerait lieu à des effets, en principe mesurables, et 
qui permettraient, par conséquent, de mettre en évidence le mouvement relatif des deux systèmes 
inertiels; ceci serait évidemment contraire au principe de relativité. 


A ce stade on peut se poser la question : pourquoi “principe de relativité” et non 
pas “théorème de relativité” ? Il semble bien, en effet, que nous ayons démontré un 
“théorème de relativité” et non pas évoqué un principe. En réalité nous avons bien 
utilisé le principe de relativité galiléen, quoique de manière implicite, notamment 
lorsque nous avons considéré des forces d’interaction de la forme F;;;) (X; — x;). 
Nous n’aurions pas pu démontrer le “théorème” de relativité pour des systèmes 
mécaniques soumis à des forces totalement arbitraires. Inversement, le principe de 
relativité permet de restreindre la classe des forces physiquement admissibles. 


Montrons-le rapidement sur deux exemples simples. 


(i) Considérons d’abord le mouvement d’une particule de masse m soumise à l’action d’un champ 
de force extérieur F(x,v;t) : 


2 
m PT = F(x,v;t) . 


L’uniformité de l'écoulement du temps, 


F(x,v;t+to) = F(x,v;t) , (1.10) 


(pour tout to) entraîne que F ne dépend pas du temps. De même, l’ homogénéité de l’espace entraîne 
que F ne dépend pas de la position. Le méme type de raisonnement implique que F ne dépend pas 
de v si F doit être la même dans tous les repères d’inertie. Enfin, l’isorropie de l’espace 


RF=F (1.11) 
(pour toute rotation R) entraine finalement que F=0! Le seul mouvement compatible avec le 
principe de relativité galiléen est donc le mouvement libre. . .. Cela ne signifie évidemment pas 


que des forces extérieures ne puissent exister en tant que modèles approximatifs pour des systèmes 
dynamiques compliqués, dont tous les degrés de liberté ne nous intéressent pas. Par exemple, si nous 
considérons le mouvement d’une particule chargée dans le champ magnétique d’un solénoide, la 
véritable interaction qui, elle, satisfait bien au principe de relativité, est celle de la particule chargée 
considérée, avec celles qui constituent le solénoide : le champ magnétique traduit simplement cette 
interaction sans qu’il soit nécessaire d’écrire (et de résoudre!) les équations des +107 particules 
du solénoïde. 


Gi) Considérons maintenant un système constitué par deux particules interagissant par l'in- 
termédiaire d’une force indépendante des vitesses et, pour simplifier (mais le résultat final est, 
en fait, indépendant de cette hypothèse), dérivant d’un potentiel V (x1 ,x2;t) : 


Fas) = — 58 V 
Les mêmes raisonnements que ci-dessus conduisent alors à admettre pour V la forme générale 
V = V(lxj=x;l) bj =1, (1.12) 
dont il découle immédiatement que 


Fos) = —F (ji) Xi —X5 ; (1.13) 
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Dans ce cas, le principe de relativité impose que la force d’ interaction soit centrale et obéisse, en 
outre, au principe de l’action et de la réaction 


Faj tF Gay) =0. 


Les principes d’inertie et de relativité 
vus par Galilée 


Voici, extrait de l’ ouvrage de Galilée Dialogue sur les deux principaux systèmes 
du Monde - le ptoléméen et le copernicien (1632), une citation classique qui montre 
comment, au XVH® siècle, on pouvait exprimer ces principes : 


“Enfermez-vous, avec quelques amis, dans une vaste salle, bien à couvert, au fond d’un grand 
navire; munissez-vous de mouches, de papillons et d'autres petits animaux volants; prenez un 
grand vase d’eau et mettez-y des poissons; suspendez au plafond un petit seau dont l’eau tombe 
goutte à goutte dans un autre vase à col étroit, posé sur le sol : le navire restant immobile, observez 
soigneusement comme les petits animaux volètent avec des vitesses égales dans toutes les directions 
de la salle; les poissons nageant indifféremment de tous côtés; les gouttelettes tombant toutes dans 
le vase posé par terre; et vous-même lançant quelque chose à un ami, n’aurez pas besoin de lancer 
avec plus de force dans une direction plutôt que dans une autre, pour des distances égales; si vous 
sautez, comme on dit, à pieds joints, vous parcourrez des distances égales dans tous les sens... 


Mettez maintenant le navire en marche, aussi vite que vous voudrez. Alors (pourvu que le mouvement 
soit uniforme, et non oscillant de-ci, de-là) vous ne discernerez pas le moindre changement dans 
les effets décrits et aucun d’entre eux ne pourra vous indiquer si le navire est en mouvement ou 
arrêté; en sautant vous franchirez les mêmes distances que précédemment et, même si le navire se 
meut à une très grande vitesse, vous ne ferez pas des sauts plus grands vers la poupe que vers la 
proue, bien que, pendant que vous serez en l'air, le sol de la salle se déplace dans le sens contraire 
à votre saut; et si vous jetez quelque chose à votre ami, vous n'aurez pas besoin de le lancer avec 
plus de force, qu’il se trouve vers la poupe ou que ce soit l’inverse; les gouttelettes continueront 
à tomber dans le vase inférieur, sans qu'une seule tombe vers la poupe, bien que, pendant que la 
gouttelette est dans l'air, le navire parcourt une bonne distance; les poissons dans leur eau et sans 
plus de fatigue nageront d'un côté ou de l’autre. . .; enfin les papillons et les mouches continueront 
leur vol indifférent dans toutes les directions. . . La cause de la permanence de tous ces effets, c'est 
que le mouvement est commun au navire et à tout ce qu’il contient, y compris l'air. . .” [Traduit par 
J.M. Lévy-Leblond (1965).] 


La gravitation newtonienne 


La théorie newtonienne de la gravitation provient de l’étude du mouvement 
des planètes par Kepler, sur la base des observations remarquablement précises 14 
de Tycho Brahé (1588) et, naturellement, grâce aux élaborations théoriques des 
notions d’inertie, de mouvement, de système mécanique, de force, etc. 


Rappelons que les trois lois de Képler sont les suivantes : (i) les orbites des planètes sont des 
ellipses (jusqu’à Kepler, elles étaient considérées comme circulaires; il fallait un très grand soin, 
sans parler d’une excellente acuité visuelle, pour que les observations de Tycho Brahé permissent 
de distinguer sans discussion possible entre des cercles et des ellipses); (ii) dans des temps égaux, 
les rayons vecteurs balaient des aires égales [c’est la loi des aires [Fig. 1.7]; elle est équivalente à 


14. Rappelons qu’elles étaient faites à l’œil nu... 
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la conservation du moment cinétique [x A vi = const. (V : vitesse, X : rayon vecteur)] 15, (iii) le 
carré de la période de révolution est proportionnel au cube du demi-grand axe de l’ellipse : 


T? = amas (1.14) 


GMg 


(Mo masse du Soleil; a : demi-grand axe de |’ ellipse décrite par la planète considérée). 


positions de la planète pendant 
un même intervalle de temps 


Figure 1.7 : La loi des aires. Si la Terre (ou toute autre planète) parcourt AB et A’ B’ pendant un 
même intervalle de temps, alors les triangles curvilignes SAB et SA! B' ont la même surface (S est 
la position du Soleil en l’un des foyers de l’ellipse qu'est la trajectoire de la planète considérée). 


Elle est basée sur la loi d’attraction universelle des graves, donnée par Newton 
pour la première fois 15 (1687) : 


mMm 


F (2) = -G niz (1.15) 


T12 
où F(12) est la force de gravitation entre deux corps de masses m1 et m2; où T12 
est leur distance; où n12 est un vecteur unitaire porté par l’axe qui joint les deux 
corps; et où G est la constante de gravitation 


G = 6.67 x 1078 CGS. 


Examinons brièvement les principales caractéristiques de la force de gravitation. 
La première est que l’action entre les deux corps s’effectue instantanément et à 
distance. Ceci est tout à fait contraire à l’intuition physique selon laquelle l’action 
d’un corps sur un autre nécessite un certain temps, une propagation à vitesse finie, 
pour s’actualiser. Cette critique, dont Newton était parfaitement conscient 17, devait 


15. Les conceptions péripatéticiennes du mouvement et de la force, génératrice de vitesse, auraient 
conduit à une force de gravitation en 1/r; en effet, comme Fov et vx1/r, Képler aurait pu en déduire 
F#1/r. 

16. En fait, de nombreux philosophes de son époque penchaient vers une loi de force en 1/r? (Hooke, 
par exemple) mais avaient été incapables de la démontrer effectivement. 


17. “Que la gravité soit innée, inhérente et essentielle à la matière, de sorte qu'un corps puisse agir 
à distance sur un autre corps à travers le vide, sans aucune espèce d’intermédiaire, pour transporter 
l'action et la force d’un corps jusqu’à l'autre, voilà qui me paraît d’une si grande absurdité que nulle 
personne ayant quelque capacité de raisonnement philosophique ne pourra jamais, ce me semble, y 
ajouter crédit” [cité par B. Hoffmann (1975)]. 
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ralentir considérablement la diffusion des Principia : il fallut prés de cinquante ans 
pour que la gravitation newtonienne fût acceptée sur le continent. 

La seconde caractéristique est que, pour la premiére fois, aussi bien le mou- 
vement des planètes que celui de la Lune ou la chute des corps pouvaient être 
attribués à une même cause, décrits par une même loi. C’ était là l’un des grands 
accomplissements de la science du XVII siècle. 

Ensuite, les forces de gravitation apparaissent comme étant des forces à longue 
portée et extrêmement faibles. 


Pour deux électrons, de masse m=.91x107?7 g, le rapport entre les forces de gravitation et les 
forces électrostatiques est de 


Fgrav / Fes R 2.4x107-43 ! 


La loi d’ attraction universelle présuppose encore l'élaboration du concept de 
masse. Comme nous l’avons indiqué plus haut, la notion de masse inerte (ou masse 
d’inertie) — la masse apparaissant comme coefficient de l’accélération dans la loi 
fondamentale de la dynamique — provient de deux classes de faits expérimentaux : (i) 
les chocs élastiques ou inélastiques étudiés par Marci, Wallis, Wren et Huyghens; 
(ii) la rotation uniforme des corps (Huyghens constate que le rapport des forces 
centrifuges de deux corps tournant à la même vitesse angulaire est comme le 
rapport de leurs poids). A cela, il faut ajouter une découverte due à Jean Richer 
en 1671 : en des lieux situés à des latitudes différentes, le poids des corps est 
différent (en |’ occurrence, il s’agissait d'étudier la période d’un pendule à Paris et 
en Guyane). La masse inerte est déterminée expérimentalement par collision avec 
une particule d’épreuve dont la masse sert à définir l’unité de masse : on utilise pour 
cela la conservation de l’impulsion et l’on mesure les variations de vitesse des deux 
particules; ce type de loi ne peut d’ailleurs en aucune façon servir de définition 
“opérationnelle” de la masse, contrairement aux affirmations de Mach [M. Bunge 
(1966)]. Ainsi, la masse du Soleil n’est nullement estimée à l’aide d’une collision 
mais grâce à la troisième loi de Kepler et tout le substrat théorique que l’on peut y 
inclure (seconde loi de Newton, attraction universelle, égalité de la masse inerte et 
de la masse pesante). 

Dans la loi d’attraction universelle les deux masses m1 et m2 jouent des rôles 
différents. En outre, elles jouent a priori un rôle différent de celui de la masse inerte : 
elles représentent des couplages gravitationnels des particules 1 et 2. Considérons 
donc un système de deux particules en interaction gravitationnelle. Si l’on distingue 
les masses inertes des masses gravitationnelles, les équations du mouvement de ce 
système s’écriront 


X1 — X2 


mr Yı = —Gmp,Ma, F; (1.16) 


[xı — x2? 


X2 — X1 


| 
"j 
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MI Y2 = -GMp MA, nS = (19 — 
[xı — x2| 
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où x et x2 sont les positions des particules 1 et 2. Dans ces équations les m sont les 
masses inertes, les Mp les masses graves passives (c’est-à-dire les coefficients de 
couplage de la particule qui subit le champ gravitationnel de l’autre particule) et les 
ma les masses graves actives (qui caractérisent l’intensité du champ de gravitation 
de la particule qui crée ce champ). Il est alors facile de se rendre compte que, si le 
principe de l’action et de la réaction (troisième loi de Newton) est vérifié, 


Faz + Foy = 0, (1.18) 


alors, nécessairement, mą = mp. En fait, ce principe pourrait ne pas être 
vérifié 18; c’est pourquoi il est nécessaire de tester expérimentalement légalité 
de ces deux masses (active et passive); on trouve que [L.B. Kreuzer (1968); voir 
aussi l'interprétation de C. Will (1976)] : 


MA — Mp < 5x105. 


Mp 
Venons—en maintenant à l'égalité éventuelle de la masse inerte my et de la masse 


grave passive mp. Dans un champ de gravitation uniforme g, la loi de la dynamique 
s’écrirait 


MIY = MB; (1.19) 


ceci entrainerait que les corps tombant en chute libre n'auraient pas le même 
mouvement : on trouverait 

a(t) = + ge (1.20) 

2m I : f 

où z(t) est l'altitude au temps t d’une particule pesante lâchée à ¢ = 0 sans vitesse 
initiale. L'expérience a été faite par Galilée 1 — plutôt sur des plans inclinés qu’à 
la tour de Pise — et l’on constate que l’on a sensiblement mp ~ mr. De même, 
Si Mp # Mr, des pendules de même longueur auraient des périodes différentes, 
proportionnelles à (mp/mz)!/? : expérience a été effectuée par Newton qui a 
trouvé que 


Mi — Mp < 1073. 


Mp 


Des expériences plus récentes [Chap. 7] et non contestées 2° donnent 


18. Par exemple, il ne l’est pas dans le cas des forces électromagnétiques. 

19. Au V° siècle de notre ère, le grammairien et philosophe Philoponos effectuait déjà des expériences 
sur la chute des graves; mais il ne sut pas, comme Galilée, faire abstraction de phénomènes non essentiels, 
telle la résistance de l’air [B. Cohen (1960)]. 

20. V.B. Braginskii (1972) annonce |ôm/mf<10712, mais ce résultat est généralement considéré 
comme douteux. 
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mr Mp! — 49-11 
> 


Mp 
et l’on espère, dans un avenir que l’on souhaite proche, grâce à des expériences 
effectuées à bord de satellites, obtenir une précision meilleure que 10717 et même 
10720 

On peut donc poser avec une excellente précision (l’une des meilleures de toute 
la physique) 


MI = Mp, (1.21) 


et faire de cette égalité un principe fondamental, le principe d’équivalence faible. 
Quelles en sont les principales conséquences ? 

Pour le voir, considérons un système de particules interagissant par lin- 
termédiaire de forces à deux corps F(;;)(x1 — x;) et plongé dans un champ de 
gravitation homogène et uniforme g. Dans un système de référence galiléen, on 
peut alors écrire 


2 
mi a = SO Fap (i -x;) + mig, (1.22) 
Ji 
pour l’équation du mouvement satisfaite par la i~8me particule. Plaçons-nous 
maintenant dans un système de référence en chute libre dans le champ g, donc 
dans un système de référence non galiléen car accéléré par rapport au système 
inertiel dans lequel on a écrit les équations du mouvement; soit encore 


t =t 
(1.23) 
x =x- įg. 
Dans ce référentiel, il est facile de s’apercevoir que les équations dynamiques 
du sytème considéré s’écrivent 


ies Fu; ix y 1.24 
Mi dd? — ap Gi x"). (1. ) 
Ji 

Autrement dit, dans ce référentiel en chute libre, le champ de gravitation extérieur 
n'apparaît pas et ne joue aucun rôle dans la dynamique du système; ses effets ont 
été totalement annulés. 

Si l’on avait, par exemple, considéré le cas d’une particule pesante, dans un système de référence “en 

chute libre”, elle décrirait, comme toute autre particule pesante non soumise à d’autres forces que 


celle du champ de pesanteur, une trajectoire rectiligne sur laquelle son mouvement serait uniforme. 
Ce système de référence peut donc, en un sens, être considéré comme inertie]. 


De manière générale, on peut toujours annuler localement |’ effet d’un champ 
de gravitation newtonien, même non homogène (tel celui de la pesanteur terrestre), 
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par le choix d’un systéme de référence en chute libre (et de coordonnées adaptées, 
évidemment), pourvu que les distances caractéristiques du systéme soient notable- 
ment plus petites que la longueur caractéristique sur laquelle varie le champ de 
gravitation [Fig. 1.8]. 


> 
w 


PEEN E EENE EA PEER. ERE 


(a) (b) 


Figure 1.8 : L’ascenseur d'Einstein. Dans un champ de gravitation sensiblement homogène (a) (les 
dimensions de l'ascenseur sont très faibles devant celles où varie le champ de gravitation), un ascenseur 
en chute libre constitue un système inertiel : deux particules au repos, A et B, le restent; une particule 
libre C poursuit son mouvement rectiligne et uniforme, dans ce repère. Par contre, lorsque le champ 
n'est pas homogène (b), un observateur lié à l'ascenseur peut décider qu'il se trouve dans un champ 
de gravitation extérieur au vu des comportements des particules A et B : tombant vers le centre de la 
Terre — en suivant les lignes de force du champ —, elles auraient tendance à se rapprocher lune de 
Pautre. 


La seconde conséquence de l’ égalité des masses grave et inerte est très importante 
sur le plan théorique; il n’est plus possible de trouver de système d’inertie car 
tout corps matériel est nécessairement en interaction gravitationnelle avec le 
reste de l’ Univers! Autrement dit, à l’inverse des forces électromagnétiques pour 
lesquelles il existe des corps électriquement neutres, il n’existe pas de matière 
pesante qui soit neutre gravitationnellement. Cette absence de système d’inertie 
global implique également que les accélérations cessent d’avoir un sens absolu, 
du moins localement. Si l’on accepte, en effet, l’idée d’un espace absolu, alors 
les accélérations ont encore un sens absolu, même globalement. Ceci pouvait 
constituer, aux yeux de Newton et de ses successeurs, une raison supplémentaire 
pour l'introduction d’un éther. 

Du fait que les effets dynamiques des forces de gravitation, pour des champs 
suffisamment homogènes, ne dépendent pas des caractéristiques intrinsèques des 
corps (comme leur masse ou leur charge), elles apparaissent plutôt comme des 
caractéristiques géométriques de l’espace, lequel cesse alors d’être euclidien ?1 : 
ce point de vue peut être concilié avec la théorie newtonienne [P. Havas, (1964), 
A. Trautman (1963)] et représente l’un des fondements de la théorie d’Einstein de 


21. Voir Gauss, Lobachevski, Clifford, Riemann dans J.L. Coolidge (1963). 
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la gravitation qui, toutefois, ne prend pleinement son sens [Chap. 7] que dans le 
cadre d’une unification, autre que qualitative, des concepts d’espace et de temps. 

Une dernière remarque concernant la loi d’ attraction universelle est que la force 
de gravitation due 4 une particule de masse m, située en x, et agissant en un point 
de coordonnées y, dérive du potentiel de gravitation 


(lx —y|) = Dr. (1.25) 


de sorte que le potentiel de gravitation en x dû à un ensemble de particules situées 
en des points de coordonnées x;, peut s’écrire 


v(x) = -G yo aa (1.26) 


où l’on a fait implicitement l’hypothèse de l’additivité des interactions dues à 
chaque particule. Cette hypothèse ne va pas de soi et se trouve violée à l’échelle de 
la microphysique, du moins sous cette forme. 

Notons enfin qu’en appliquant l’opérateur laplacien, 


2 


a=% vE] (1.27) 
~ Ox,2 ~ 10x} ? : 
à l'expression précédente de y, on trouve facilement que 

Ag(x) = 4rGp(x), (1.28) 


c’est-à-dire l’ équation de Poisson. Dans cette équation p(x) est la densité de masse 
des particules en x. 


En posant 
p(x) = D>, m6 (xx), (1.29) 
où 5) (x—xı) est la distribution de Dirac (densité de masse +1 située en x;) et en utilisant le fait 
que 
A hy = — 40d (x), (1.30) 


il vient bien l’équation de Poisson. Le potentiel de gravitation s’écrit aussi, avec ces définitions et 
propriétés 22, 


X) = — 3 pf Oz!) ` 
v(x) = -G f da’ e (1.31) 


x—x’| ` 
Mesure de la constante de gravitation 


La valeur de la constante de gravitation, entrant dans la loi d’ attraction universelle 
de Newton, joue évidemment un rôle très important dans tous les phénomènes 


22. Rappelons que f dx! 6°) (x—x’) f(x’)=f (x), où f(x) est une fonction continue quelconque. 
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gravitationnels. On pourrait essayer de déterminer G à l’aide des oscillations d’un 
pendule simple. Cependant, cela ne serait pas très précis car, ce que l’on mesure 
effectivement, c’est l’accélération de la pesanteur, g, elle-même reliée à la constante 
de gravitation par la relation 


_ CMe 

= Ro? ; 
où Meest la masse de la Terre et Re son rayon 7? et où l’on a négligé l’effet de la 
force centrifuge due à la rotation de la Terre (cet effet est cependant de l’ordre de 
quelques pourcents : g = 9.83 à l’équateur et 9.78 au pôle) : malheureusement, pas 
plus la masse de la Terre Mg que son rayon Rg ne sont connus avec suffisamment 
de précision. 

Ainsi, la détermination de G est strictement impossible à l’aide des seules 
forces gravitationnelles importantes disponibles, c’est-à-dire celles des planètes 
et de leurs satellites, leurs masses n’étant pas connues de manière suffisamment 
précise. Aussi seules des expériences de laboratoire permettent-elles de déterminer 
G, encore que la faiblesse de ce type d’interaction n’autorise pas, actuellement, 
l’obtention de plus de trois chiffres significatifs. 

Historiquement 2+, la première mesure précise de G est due à Cavendish (1798), 
grâce au pendule de torsion, inventé indépendamment par Coulomb et Michell vers 
1750. Le principe de l’expérience est le suivant : deux masses sont suspendues 
aux extrémités de l’équipage mobile d’un pendule de torsion [Fig. 1.9]; lorsqu’on 
en approche deux masses nettemeñt plus importantes, I’ attraction gravitationnelle 
entre les paires de masses fait dévier le pendule; la mesure de cette déviation permet 
alors le calcul de G. 

L'expérience de Cavendish [Fig. 1.10] est probablement la première expérience de physique qui soit 

véritablement moderne, notamment par la recherche systématique des causes d’ erreurs possibles et, 

naturellement, des remèdes à y apporter. Enumérons—en quelques-unes ainsi que les solutions de Ca- 
vendish. Il existe d’abord des gradients de température à l’intérieur de |’ appareil, ce qui entraîne des 
courants de convection. Il était donc nécessaire d’enfermer la balance du pendule à l’intérieur d’une 
enceinte close ayant les dimensions les plus petites possible. En outre, l’ensemble de l’expérience 
était également enfermé dans un logement plus important. De plus, pour éviter de perturber l’appa- 
reil, il fallait encore pouvoir le contrôler à distance : c’est ainsi que la position des grosses masses 
W est déterminée par une poulie M reliée à un fil à l’extérieur de l’enceinte m; de même, la remise 
au zéro de la position de l’équipage mobile du pendule, qui comprend les petites masses s, s’ef- 
fectue par l'intermédiaire d’une tige rigide FK et d’un engrenage; enfin la lecture de la déviation 
du pendule est effectuée par l’intermédiaire d’un vernier, éclairé de l’extérieur L et dont les gra- 
duations sont lues à travers une lunette T'. Une autre cause d’erreur importante est l'effet du champ 
magnétique terrestre : l’usage de matériaux non magnétiques était donc indispensable, quoique des 

effets résiduels soient possibles (plomb insuffisamment pur des grosses masses W, par exemple). Il 

fallait encore estimer I’ effet de la convection, due aux gradients de température dans l’appareil (les 

masses de plomb W ne se refroidissaient pas de la même manière que les autres matériaux, pendant 


(1.32) 


23. Mg=5.977x 10?" g ; Re=6.3718x 108 cm. 
24. Nous suivrons ici l’exposé de F. Everitt (1975). 
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la nuit, par exemple); |’ effet du mouvement brownien 2°, dû al agitation moléculaire, sur l’équipage 
mobile du pendule (cet effet était négligeable, compte tenu de la précision de l’expérience); l'effet 
des secousses sismiques (négligeable également), etc. 


€ 
(1) (1) 


Figure 1.9 : Principe de la mesure de G. Un pendule de torsion, dont l'équipage mobile comprend 
deux “petites” masses d’épreuve, est soumis à l’action gravitationnelle de deux “grosses” masses, selon 
deux positions différentes (1) et (2). Dans l'expérience de Cavendish (1798), on mesure la déviation de 
l’équipage mobile du pendule lorsqu'on fait varier les positions des “grosses” masses. Par contre, dans 
la mesure de Heyl (1930), on évalue la variation de la période d’oscillations du pendule : la proximité 
(ou Péloignement) des “grosses” masses produit une force de rappel supplémentaire due à l'attraction 
gravitationnelle exercée sur les “petites” masses, donc proportionnelle à G. 


Figure 1.10 : L’expérience de Cavendish (1798). Deux petites masses s sont suspendues au bout 
de l'équipage mobile d’un pendule de torsion dont la position est mesurée (i) en l'absence de grosses 
masses W et (ii) en leur présence à l’aide d'un petit télescope T. La distance entre les deux petites masses 
s est d'environ deux mètres. L est un bougie servant à éclairer l’appareillage. FK est une tige rigide 
permettant la remise à zéro de l'équipage mobile du pendule. La poulie M permet, par l'intermédiaire 
du fil m, d'approcher ou d’éloigner les grosses masses W. 


25. Le “mouvement brownien” a été découvert en 1827 par le botaniste R. Brown. Il s’agit donc là d’une 
source d'erreur que Cavendish ne pouvait guère imaginer. . . 
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Par la suite, plusieurs améliorations importantes, qui augmentérent encore la 
précision de la mesure, furent apportés par Boys (1889). Ce furent, d’une part, 
Tusage de fibres de quartz (au lieu de fils d’ argent, dans l’ expérience de Cavendish) 
et, d'autre part, l’utilisation du miroir de Poggendorf (“levier optique”), comme 
méthode de lecture. Enfin, Boys réalisa que la précision de cette expérience pouvait 
être améliorée en diminuant sa taille, contrairement a l’intuition immédiate, 6 
pieds (182.88 cm) 5/8 pouces (1.59 cm). La raison en est que si les “grosses” 
masses peuvent être augmentées, la précision angulaire reste la même. En outre, 
une plus faible taille permet de limiter les courants de convection, les gradients 
de température étant plus faibles. Diverses améliorations furent ensuite apportées 
[Tableau 1.1] jusqu'aux toutes dernières expériences qui utilisent des méthodes 
différentes dans leur principe. 


Cavendish 1798 6.754 
Reich 1838 6.70 
von Jolly 1881 6.465 
Wilsing 1889 6.596 
Poynting 1894 6.698 
Boys 1895 6.658 
Braun 1896 6.658 
von Eötvös 1896 6.65 
Richard et al. 1898 6.685 
Burgess 1901 6.64 
Crémieu 1909 6.67 
Heyl 1930 6.670 
Zahradnicek 1933 6.659 
Heyl et al. 1942 6.673 
Rose et al. 1969 6.674 
Facy et al. 1972 6.6714 
Sagitov et al. 1977 6.6745 
Luther et al. 1982 6.6726 


Tableau 1.1 : Quelques résultats de la mesure de G 
(G est en unités de 1078 CGS) 


La première expérience moderne est celle de Heyl (1942). Au lieu de mesurer 
la déviation d’un pendule de torsion, on mesure plutôt sa période pour deux 
positions différentes des “grosses” masses : le changement de période permet de 
déterminer G. La mesure d’une période d’ oscillation étant plus précise que celle 
d’une déviation, on obtient alors une valeur plus exacte de G. 

La seconde expérience est due à R.D. Rose et al. (1969) 2°. Son principe est 
toujours celui de l’expérience de Cavendish mais l’ensemble de l appareil peut 
tourner autour d’un axe vertical. Les deux “grosses” masses tendent à faire tourner 
l'équipage mobile du pendule de torsion [Fig. 1.11] mais un servomécanisme 
fait alors tourner l’appareil en sens inverse, de manière à annuler la déviation 
du pendule de torsion. L'appareil tourne alors autour d’un axe vertical (celui de la 


26. Voir aussi Beams (1971). 
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faisceau incident 


source lumineuse 


Figure 1.11 : L’expérience de R.D. Rose et al. (1969). 


fibre qui soutient l’équipage mobile du pendule) avec une accélération sensiblement 
uniforme (de l’ordre de 5 x 10~® radians/s?) que l’on mesure et dont on peut déduire 
directement la valeur de G. 

Le tableau 1.1 donne les résultats de quelques expériences. Les chiffres qui y 
figurent représentent 108 G, en unités CGS. D’après Beams (1971) l’erreur relative 
sur G est probablement de l’ordre de 5 x 10%, au minimum, sauf pour la dernière 
mesure où elle serait seulement de l’ordre de 107%. 

En fait, toutes ces expériences présupposent la validité de la loi d’attraction 
universelle ?7 en 1/r? : mm’/r?. En réalité, cette loi n’est bien vérifiée qu’à 
l’échelle des distances du système solaire; aussi peut-on se poser la question de 
savoir s’il en est de même à l’échelle du laboratoire [D.R. Long (1974)]. Si la 
loi d’attraction universelle n’est pas en 1/r? à des distances plus faibles, on peut 
toujours l'écrire sous la forme très générale 


mm’ 

F = G(r) 72? (1.33) 
où la “constante” de gravitation sera une fonction lentement variable (inconnue, 
en général, à moins de présupposés théoriques) de la distance. Il suffit donc, en 
principe, de mesurer G à plusieurs distances : une loi de gravitation en 1/r? donnera, 
aux erreurs d’expérience près, la même valeur de G, quel que soit r. Pour obtenir 
une indication préliminaire, il suffit de reprendre les mesures précédentes de G; 
c’est précisément ce qu’a fait D.R. Long (1974). Le tableau 1.2 représente ces 
mesures. La figure 1.12 [D.R. Long (1974)] indique une vague tendance de G à 


27. Une liste quasi exhaustive des diverses mesures de G effectuées, des principales sources d’erreur, 
etc., peut être trouvée dans G.T. Gillies (1983). 
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6.71 
6.70 
6.69 
6.68 
6.67 


Sen CGS) 


x 10 


G 
a 
a 
a 


6.65 


distance (en cm) 


Figure 1.12 : Valeurs de G en fonction de la distance {d'après D.R. Long (1974)]. Si G ne varie pas 
avec la distance, on s'attend que les diverses mesures se répartissent autour d’une droite horizontale. 
En pointillé est dessinée la droite G = const., classique. En trait continu est indiquée la droite des 
moindres carrés; elle indique bien une tendance de G à varier avec la distance. Cependant, les barres 
d'erreurs sont telles qu'une conclusion quelconque serait, pour le moment, tout à fait hasardeuse. Les 
coordonnées sont semi-logarithmiques. 


varier avec la distance, ainsi qu’une expérience semble le confirmer [D.R. Long 
(1976)]. Toutefois, compte tenu des erreurs expérimentales, compte tenu aussi 
d’autres expériences [V.I. Panov et V.N. Frontov (1980); etc.], il semble bien que 
l'on puisse considérer G comme une constante et donc que la loi en 1/r? soit 
valable à l’échelle du laboratoire. 


Boys (1894) 6.6576 + 0.002 6.3 cm 
Braun (1896) 6.655 + 0.002 8.6 cm 
Poynting (1891) 6.6984 + 0.029 32 cm 
Richard et al. (1898) 6.685 + 0.011 80 cm 
Heyl (1930) 6.670 + 0.005 13 cm 
Heyl et al. (1942) 6.673 + 0.003 13 cm 
Rose et al. (1969) 6.674 + 0.004 12 cm 


Tableau 1.2 : Mesures de G en fonction de la distance des masses 


Diverses considérations théoriques avancées ces dernières années [voir les 
références 1 à 15 dans E.G. Adelberger et al. (1990)], suggèrent l’idée d’une 
“cinquième force”, en plus des quatre connues (les forces gravitationnelle, élec- 
tromagnétique, nucléaire et faible). Cette cinquième force, s’ajoutant à l attraction 
universelle de Newton, la modifierait; ce que maintes expériences ont tenté de 
mettre en évidence, sans pour autant parvenir à des conclusions définitives. Parmi 
les hypothèses les plus souvent considérées, on imagine que cette cinquième force 
dérive d’un potentiel de la forme 


e7712/To 


2 
(ria) = + À (as) (gs) —— , 


ou d’une combinaison linéaire de telles expressions : g? est une constante universelle 
tandis que q5 dépend du corps considéré. Selon les modèles théoriques envisagés, 
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qs peut dépendre du nombre baryonique, du nombre leptonique, ou des deux, etc. 
Il s'ensuit que cette nouvelle force n'obéit pas au principe d'équivalence faible et 
donc que des expériences du type Eötvös [Chap. 7] permettent d’en restreindre 
Vintensité. En outre, la présence d’une longueur caractéristique ro indique que la 
loi de Newton pourrait être modifiée sur une telle échelle; c’est ce qui explique 
le grand nombre de vérifications de cette loi effectuées ces derniers temps. On 
trouvera davantage de détails dans l’article de E.G. Adelberger et al. (1990) cité 
plus haut. 

Une autre possibilité est que la loi d’attraction universelle puisse être valable 
mais que la constante de gravitation G ait varié au cours du temps. Toutefois, 
une telle variation, nécessairement extrêmement faible, aurait toutes sortes de 
conséquences 2%, depuis une variation du rayon de la Terre dans le passé, en 
passant par des modifications géophysiques, jusqu’à des variations du mouvement 
de satellites ou de la Lune [T.C. Van Flandern (1981)]. Il semble que l’une des limites 
supérieures les plus précises à cette variation provienne de l’étude du mouvement 
du pulsar binaire PSR 1913 + 16 [T. Damour ef al. (1988)]. Dans tous les cas, on 
trouve que cette variation est compatible avec la valeur zéro et, de toute maniére 


6 log G 1 


< 1071! année” 
ôt 


Limites de la théorie newtonienne de la gravitation 


Les lois de Newton, avec la loi d'attraction universelle, permettaient de disposer 
d’une théorie unique et rationnelle pour décrire le mouvement des planètes et de 
leurs satellites, un problème ouvert pendant deux mille ans : il n’était plus besoin 
de disposer d’un système d’épicycles [Fig. 1.13] compliqué et tout à fait ad hoc 
pour décrire leur mouvement et faire des prévisions; la loi en 1/r? suffisait et cela 
représentait une véritable révolution. 

Néanmoins, vers le milieu du XIX® siècle, quelques désaccords commencèrent à 
se faire jour (avance résiduelle du périhélie 2° de Mercure de 38” d’arc par siècle 
selon Leverrier dès 1850) qui seront précisés davantage vers la fin du siècle par 
Newcomb (42/9 pour Mercure, 8” pour Mars, 10” pour Vénus, etc.). 

Précisons un peu tout cela. Le mouvement d’une seule planète autour du Soleil 
s'effectue sur une ellipse, et le périhélie correspondant est a priori un point fixe. 
Toutefois, en raison de la présence de faibles perturbations causées par divers 
facteurs (attraction des autres planétes, aplatissement éventuel du Soleil, précession 
de la Terre, etc.) la trajectoire réelle est une sorte de rosette [Fig. 1.14] qui correspond 
à une ellipse dont l’axe principal tournerait lentement dans son plan. Il s'ensuit que 
le périhélie de la planéte considérée tourne également. 


28. Voir le chapitre 7. 
29. Le périhélie est le point de la trajectoire de la planète le plus proche du Soleil. 
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épicycles 


déférent 


> 


Figure 1.13 : Le mouvement d’une planète d’après Ptolémée. Autour de la Terre tournent les planètes 
(dont une seule a été représentée sur la figure) sur des cercles, “figures parfaites”. Le plus grand cercle 
est le “déférent”; les plus petits sont les “épicycles”. En fait, pour rendre davantage compte des données 
de l'observation, le déférent n'était pas centré exactement sur la Terre et il y avait plusieurs épicycles. 


(a) 


Figure 1.14 : Avance du périhélie d’une planète. En (a) P représente le périhélie et S le Soleil; en (b) 
on a montré, en l’exagérant, l'avance du périhélie P, P', P" ... 


On montre, en mécanique, que les seules forces centrales auxquelles correspondent des trajectoires 
fermées (pour une particule située dans un tel champ de force) sont de la forme Fx1/r? où For. Il 
en découle que toute perturbation, si faible soit-elle, à la loi en 1/r? va se traduire par une avance (ou 


(TAC 


un retard) du périhélie de la planète considérée : l’ellipse “s’ouvre” et tourne lentement [Fig. 1.14]. 
Par exemple, on a 


Mercure : 42/56 + 0/94 
Venus : 8'4A + 4"8 
Terre : 46 + 27 


en ce qui concerne les résidus inexpliqués par la théorie newtonienne. Ainsi, 
pour Mercure, on observe une avance du périhélie de 532” d’arc par siécle due 
uniquement aux perturbations apportées par les autres planétes et éventuellement 
imputable à l’aplatissement du Soleil, le “reste” de cette avance (5067” d’arc par 
siècle) étant dû à la précession des équinoxes (50/26 d’arc par an le long de 
l’écliptique). On constate donc que le résidu inexpliqué par la théorie newtonienne 
est tout à fait significatif, même en tenant compte des erreurs d’observations 
[G.M. Clemence (1947)]. 

Bien que des désaccords existent également concernant le mouvement de la 
Lune ou celui de la cométe d’Encke, on peut cependant trouver diverses explications 
classiques (ralentissement de la rotation de la Terre dû aux marée, en ce qui concerne 
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la Lune; existence d’un courant météorique perturbateur de la trajectoire de la 
comète) de sorte que l’essentiel de ce qui échappe à la théorie newtonienne porte 
surtout sur le mouvement des planètes et, principalement, sur celui de Mercure. 

Pour expliquer ces désaccords, plusieurs tentatives ont été effectuées, qui se 
sont révélées soit par trop arbitraires, soit en contradiction avec d’autres données 
d’observations : anneau de petites planètes, hypothèse de Seeliger à propos de la 
lumière zodiacale, corrections à (ou modifications de) la loi d’attraction universelle, 
espace physique non euclidien, etc. 

En fait, seules quelques théories relativistes de la gravitation (dont celle d’Ein- 
stein est, pour le moment, la plus plausible en même temps que la première histori- 
quement) permettent d'apporter une solution véritable — c’est-à-dire non arbitraire 
et en accord avec toutes les autres données d’ observation — à ce problème. 

La gravitation newtonienne a été parfois remise en cause ces dernières années 
[Milgrom, Sanders, etc.; cf. J. Bekenstein (1988) pour une revue et d’autres 
références] au vu des courbes de rotation des galaxies spirales [Fig. 1.15]; celles-ci 
présentent, à grande distance, un plateau caractéristique alors que l’on s’attendrait 
plutôt à une décroissance de la vitesse en fonction de la distance. 
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Figure 1.15 : Courbe de rotation de galaxie spirale. Notez le plateau caractéristique aux grandes 
distances. 


Considérons une galaxie spirale, comme la nôtre, en rotation. Une étoile-test en co—rotation à la 
distance r du centre est telle que 


mv? = GmM | 


où m la masse de l’étoile-test et M la masse totale de la galaxie. La loi de Newton ne saurait donc 
expliquer ce plateau caractéristique présent dans toutes les courbes de rotation, puisque u?#1/r. 


Cependant, la présence de matière non visible °° — sous forme de particules 
exotiques (ions divers, matière étrange, etc.) — peut permettre d’expliquer ce plateau 
sans qu’il soit nécessaire de modifier la loi d’attraction universelle. Toutefois, cette 
matière noire n’a pas encore été mise en évidence. 


CRT: 19 Le PAL 


30. Ou “matière noire”, “matière invisible”, “matière cachée”, etc. 
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Le caractère fini de la vitesse de la lumière 


Un élément très important dans la genèse de la relativité est constitué par la 
découverte du caractère fini de la vitesse de la lumière. II n’était pas du tout évident, 
au XVIIe siècle, que cette vitesse fût finie. Ainsi, Descartes avait la “certitude plus 
que morale” que la lumière se propageait instantanément, au contraire du Père 
Mersenne *! ou de Galilée qui tenta d’en mesurer la vitesse. 
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Figure 1.16 : La mesure de Rômer de la période d’occultation de Jo (l’un des satellites de Jupiter). 
T; et T;4% désignent les positions de la Terre après j et j+k retours de Io. 


La première mesure [Fig. 1.16] de la vitesse de la lumière est due à l’astro- 
nome danois O. Rômer (1675) qui, observant Ja période d’ occultation 32 (environ 
42 heures) de l’un des satellites de Jupiter 33, Jo, avait constaté qu’en six mois de 
l’année, cette période — qui aurait dû être constante — ralentissait d’environ 1300 se- 
condes : Io, qui aurait dû reparaitre à intervalles réguliers, était de plus en plus en 
retard par rapport aux prédictions. La seule conclusion possible pour expliquer ce 
désaccord, celle de Römer, était la suivante : en six mois la distance Terre—Jupiter 
a varié d’ peu près un diamètre de l’orbite terrestre (Jupiter possède une période 
d'environ 12 ans et, en six mois, se déplace en gros de 12°) et le retard observé cor- 
respond au temps supplémentaire mis par la lumière pour parcourir cette distance 
(le diamètre de l'orbite terrestre est de l’ordre de 3 x 1013 cm). Par la suite, bien 
d’autres procédés seront utilisés. 


Le principe de la mesure de Römer est le suivant : un observateur situé sur Terre mesure l’intervalle 
de temps dt; entre k retours consécutifs de Io, sortant de l’ombre de Jupiter [Fig. 1.16], et soit A4£ 
le changement de distance entre la Terre et Jupiter pendant l'intervalle de temps 64. La vitesse de 
la lumiére étant supposée finie et égale 4 c, on a alors 


31. ... Qui mesura pour la premiére fois la vitesse du son. 

32. En fait, c’est la date de l’occultation qui était observée. O. Rômer s’est d’abord basé sur les 
observations de Cassini. 

33. L'invention de la lunette de Galilée (1610) avait permis la découverte, également par Galilée, de 
quatre des satellites de Jupiter. 
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5th = kTo + LÉ, (1.34) 


où To est la période d’occultation du satellite de Jupiter. Cette dernière équation comporte deux 
inconnues To et c. To peut être déterminé de la façon suivante. Si, au bout de m retours consécutifs, 
la période d’occultation T reprend sa valeur initiale, alors Am £=0 et donc 5tm=mTp. Les grandeurs 
tm et m sont directement accessibles à l’observation. Pour déterminer c, il suffit d’évaluer le nombre 
n de retours de Io qui se produisent lors de deux positions diamétralement opposées de la Terre sur 
son orbite. Si D est le diamètre de cette orbite, on a alors A,,2=D, et donc 


= D = D . 
O= Sta- nTo ~ bin Atm | (1.35) 


notons que, dans cette dernière relation, ne figurent que des grandeurs directement observables. Avec 
les chiffres dont il disposait, Römer trouvait c~ 200 000 km/s, qui constitue une valeur correcte en 
ordre de grandeur. 


Cet effet de ralentissement [M. Jammer (1979)] de la période d’ occultation de Io 
est un effet cumulatif que l’on peut interpréter comme une espèce d’ effet Doppler. 
Pour le voir, considérons la Terre à six mois d’intervalle; pendant cette durée, 
Jupiter a peu varié sur sa trajectoire. Si T est la période alors mesurée et si v est 
définie par 


v 


ill 


D 
T (1.36) 
alors, posant maintenant v = T—! et vo = Ty 7}, l'équation 


D 


peut se réécrire comme 
v = ~w({1-8), (1.38) 


avec 8 = v/c. C’est la formule de l’effet Doppler pour une Terre fictive allant en 
ligne droite le long d’un axe 7172 [Fig. 1.17]. 
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Figure 1.17 : La variation observée de la période d’occultation de Io peut être interprétée comme une 
sorte d’effet Doppler pour une Terre fictive se propageant en ligne droite de Ti à T2 en l’espace de six 
mois. 
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Les données numériques correspondantes sont: D & 2 x 10/3 cm; To ~ 42 
heures; période de Jupiter % 12 ans; écart de la période en 1675 œ% 22’ (aujourd’hui 
= 16’). 

Rétrospectivement, importance du caractère fini de la vitesse de la lumière 
nous apparaît plus clairement. En effet, si la vitesse de la lumière était infinie, les 
équations de Maxwell 


VE =0,VB = 0 
(1.39) 
a 
VAE = -8,VAB=4@, 


ne contiendraient pas le “courant de déplacement” (—0E/ôt) et les équations 
de l’électromagnétisme seraient alors invariantes dans le groupe de Galilée. Elles 
satisferaient donc, elles aussi, au principe de relativité galiléen : conservant la même 
forme dans deux repéres galiléens arbitraires, on ne pourrait mettre en évidence 
leurs mouvements relatifs par des moyens électromagnétiques. On peut d’ailleurs 
montrer que, précisément, une limite non relativiste des équations de Maxwell 
est obtenue en augmentant indéfiniment la vitesse de la lumière, ce qui revient 
effectivement à supprimer le courant de déplacement [M. Le Bellac et J.M. Lévy- 
Leblond (1973)] *4 

Toujours est-il que les équations de Maxwell ne sont pas invariantes dans le 
groupe de Galilée; il devrait donc étre possible, du moins en principe, de mettre 
en évidence, à l’aide de phénomènes électromagnétiques, le mouvement relatif de 
deux systèmes d’inertie. 


Les équations de Maxwell (1.39) conduisent, après des calculs simples, aux équations 


NDE-0,0B-0, (1.40) 


=, 2302 
D=4 2-A 1.41 
TT ok, (1.41) 
équations que l’on peut résumer par 

Oy =0, (1.42) 
dans un système d'inertie donné. Dans un autre système d’inertie, on peut écrire 


(x,t) = »[g~*(x,t)] 


où g désigne une transformation de Galilée et où l’on a indiqué par les mêmes symboles les 
coordonnées d'espace et de temps dans les deux systèmes d'inertie. Autrement dit, la fonction 
y et sa transformée sont ainsi considérées comme éléments d’un même espace fonctionnel. Ainsi, 
en nous limitant à des transformations de Galilée pures 


x’ =x — vt, t =t (1.43) 


(ce qui ne restreint pas véritablement la généralité du raisonnement), on a 


34. Voir, cependant, ces auteurs pour diverses subtilités physiques quant au passage à la limite. 
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g(a’ t) = p(x tvt t), (1.44) 
ou encore, avec une désignation identique des variables dans les deux systèmes d’inertie 
o' (x,t) = p(x+vt,t) . (1.45) 
Remarquant maintenant que l’on peut également écrire 
(x,t) = p'(x-vtit), (1.46) 
F équation des ondes Oy=0 s’écrit alors 
4 2 + (4% -22718 a} get) = 0 (1.47) 


où l’on a tenu compte du fait que 


È£ p(x,t) = —v.vy' (x—vi,t) + g p'(x-vt;t). (1.48) 


L’équation des ondes possède donc des formes différentes dans les deux systèmes d’inertie animés 
lun par rapport à l’autre d’une vitesse V. 


Avec l'identification par Maxwell des ondes lumineuses aux ondes électro- 
magnétiques, il semblait nécessaire qu’existât un support matériel à leur propa- 
gation, l’éther, un concept dû également à Maxwell. Interprétant à la fin de sa vie 
(1879) la mesure de Römer, il remarquait que la même mesure effectuée à six ans 
d’intervalle (c’est-à-dire lorsque Jupiter a parcouru la moitié de son orbite) pou- 
vait, en principe, permettre de mettre en évidence le mouvement du système solaire 
par rapport à cet hypothétique éther [Fig. 1.18]. 
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Figure 1.18 : Mesure de Rémer effectuée 4 six ans d’intervalle. Elle permettait, en principe, de 
mettre en évidence le mouvement global du système solaire par rapport à l’éther. 


Si v est la vitesse du système solaire par rapport à l’éther et si D est le diamètre de I’ orbite terrestre, 
le retard dans la réapparition de Io (sortant de l’ombre de Jupiter) est 


t=. (1.49) 


Par contre, six ans plus tard [Fig. 1.17 et 1.18] 
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ét! = -2 (1.50) 


C—V ? 


de sorte que la différence de ces deux retards, une grandeur observable en principe, est 


= 2p E | (1.51) 


où B=v/c. Cet effet est du second ordre en v/c et est donc très faible, de l’ordre de (30/300000)?~ 
1078 ! Une conséquence en est d’ailleurs que la mesure de Römer fournit bien une mesure correcte 
de la vitesse de la lumière, sous réserve de la précision des observations astronomiques. 


L’expérience de Michelson 


A la fin du xIx® siècle, l’un des problèmes majeurs de la physique était donc 
la mise en évidence de l’éther. Déjà, quelque temps auparavant, les physiciens du 
début du siècle [Arago (1818), Fresnel (1818), Fizeau (1852), etc.] avaient essayé 
de mettre en évidence des effets du premier ordre 35 env /c, sans succès toutefois. 
Ii restait donc à tenter une expérience plus précise, susceptible de pouvoir déceler 
des effets du second ordre : c’était l’objet de la célèbre expérience d’ Abraham 
Michelson (1881), reprise plus tard par Michelson et Morley (1887) et perfectionnée 
depuis par d’autres physiciens. 

Remarquons, au passage, que la mesure de Rômer n’était pas capable de mettre 
en évidence des effets du second ordre, compte tenu de l’imprécision des données 
astronomiques. 
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Figure 1.19 : L’interférométre de Michelson (1881). Le faisceau SE est partagé en deux (EM, et 
EM) par le miroir semi-transparent E. Les faisceaux réfléchis M1 E et Mo E se recombinent en EL et 
donnent lieu à des interférences (dues à leur différence de marche) observées en L. 


35. Cf. M.A. Tonnelat (1971). 
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L’interféromètre de Michelson est constitué, pour l’essentiel, d’une source 
lumineuse S [Fig. 1.19] qui envoie un faisceau lumineux sur un miroir semi- 
transparent E, lequel décompose le faisceau incident en deux faisceaux à angles 
droits, réfléchis par deux miroirs Mı et M2 sur une lunette L. La différence de 
marche entre les deux faisceaux, due à des longueurs EM; = 4 et EM: = b 
différentes, produit des interférences, lesquelles dépendent aussi du mouvement de 
l’appareil par rapport à l’éther. Si l’on fait tourner l’ensemble de l’appareil de 90°, 
de manière à échanger les rôles de £; et £2, il devrait y avoir alors un déplacement 
des franges dû au mouvement global de l’appareil. 

Examinons cela de plus près; orientons d’abord l’appareil de manière que le 
bras EL soit parallèle au mouvement. Le temps mis par la lumière pour parcourir 
le trajet EM, E est 


l h 22, 1 
= => . 1. 
h e ee c 1-82 (652) 


Par contre, le temps mis par le second faisceau pour parcourir EME est 
1 
tg = z [EM + ME’! (1.53) 
car, pendant le temps t2, le miroir s’est déplacé en E’ [Fig. 1.20] d’une distance 


EE’ =v t2, (1.54) 


Figure 1.20 : Trajet des rayons lumineux dans l’interféromètre de Michelson. L'un des bras de 
l'appareil se meut avec une vitesse v par raport à l’éther. 


de sorte que 


t 2 1/2 
EM; + M,F’ =2 |a + a = [4 + Pe” ; (1.55) 
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Finalement, on aura 


pe a (1.56) 


e AR 


La différence de marche entre les deux faisceaux sera donc 


2 £ 
PO ed ee, (1.57) 


c | A-8 1-8 
Pour éliminer les imprécisions dues à £; et £2, faisons tourner appareil de 
90° : cela revient à échanger £; et £2. On aura ainsi un déplacement des franges 
correspondant à la différence 


ôt = At (41,2; B) — At (l2, 41; B) (1.58) 
z 2 (4 + £2) 1 1 
7 c 1-62 1-8 
5 Cith) 6. (1.59) 


Si la source émet à la longueur d’onde À, on observera un déplacement d’un 
interfrange lorsque 


; (1.60) 


donc lorsque 


hli + h & A8’. (1.61) 


Ainsi, pour un rayonnement de 5um et v ~ 30 km/s, on trouve £1 + £2 & 50m: 
cette distance peut être obtenue à l’aide de réflexions multiples. 


L'expérience de Michelson (1881) était, comme le note F. Everitt (1975), très sensible aux vibrations 
et distorsions thermiques des bras EM et EM de l'appareil : le problème est, pour beaucoup, 
un “problème de stabilité mécanique. Une mesure à un vingtième de frange près correspond à 
des déplacements de 130 À de l’un des miroirs. Un bras d’acier de 100 cm de long et de 4 cm 
de profondeur est infléchi, par l’action de son propre poids, d'une seconde d'arc; ce qui signifie 
que le bord supérieur d’un miroir qui lui est assujetti “recule” d'environ 2000 À en raison de la 
flexion du bras. Les vibrations sismiques à basses fréquences, d'amplitude 107% g, sont la cause de 
mouvements de l’ordre de 2 À et les vibrations proches de la fréquence propre du bras donnent lieu 
à des effets encore plus grands. Les distorsions thermiques sont même plus sérieuses encore. Une 
différence de température de 0.02° dans le bras le courbe d'environ une seconde d'arc” {F. Everitt 
(1975); reproduit avec l’aimable autorisation de l’éditeur]. C’est pourquoi l expérience de Michelson 
sera reprise avec Morley (1887) de manière à limiter ces sources d’erreur. 


L'expérience de Michelson—Morley pouvait déceler un “vent d’éther” de l’ordre 
de 10 km/s, bien en deçà des 29 km/s dus au mouvement de la Terre sur orbite. Or, 
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son résulat fut totalement négatif, à quelque période de l’année, à quelque altitude 
que l’on se place. Par la suite, la précision fut portée à 1.5 km/s et dans les dernières 
expériences, bien en-deçà [J.P. Cedarholm et al. (1958); A. Brillet et al. (1979, 
1982)]. 

Ce résultat négatif ouvrait un problème majeur quant aux bases conceptuelles 
de la physique newtonienne, que diverses hypothèse ad hoc ne parvenaient pas à 
sauver, et que seul Einstein devait résoudre au terme d’une analyse pénétrante des 
notions d’espace et de temps. 


EXERCICES 


1. On considère un système d’unités dans lequel A=c=1 et l’on adopte le MeV comme unité 
d'énergie. 

(i) En quelles unités s’expriment : un temps, une longueur, une masse, une impulsion, une pression, 
une densité de particules, une densité de masse, une température, la constante de Boltzmann, une surface, 
la charge électrique ? 

Gi) Mêmes questions si, au lieu d’adopter une unité d’énergie, on adopte plutôt une unité de 
longueur (le fermi; 1 fm =107+*° cm). En quelle unité s’exprime alors une énergie? 
Gii) Mêmes questions qu’en (i) et (ii) si l’on adopte, cette fois, la seconde. 


2. Vérifier que les transformations de Galilée comportent effectivement dix paramètres et forment 
un groupe. 


3. Si g={R, xo,to,v} est une transformation de Galilée, où R est une rotation, comment s’écrivent 
(i) la transformation identique, (ii) g7 +, (iii) 91.92? 


4. Pourquoi les transformations qui font passer d’un système d’inertie à un autre doivent-elles 
nécessairement former un groupe? 


5. Vérifier explicitement que les transformations de Galilée préservent les diverses structures (affine, 
métrique, causale) de l’espace-temps newtonien R°+?, 


6. Soient deux particules de masses m1 et m2, en interaction par l'intermédiaire d’un potentiel 
V(Ix1—x2|) où x; est le vecteur-coordonnée de la particule i. Ecrire l’équation de Schrödinger de ce 
système et montrer qu’elle est invariante dans le groupe de Galilée. 


7. On considère la sphère S° de rayon 1, plongée dans R4 : 

x? +y? +z? +w? =l k 
Sachant que R4 est euclidien [i.e. ds? =dx?+dy?+dz?+dw?], calculer la métrique induite sur la 
sphère 5° par celle de R4. 


8. On considère une particule de masse m soumise à l’action d’une force centrale qui dérive du 
potentiel V(r). 


(i) Rappeler pourquoi le mouvement s'effectue dans un plan. On appellera J le moment cinétique 
de la particule. 

(ii) Dans le plan du mouvement, on utilise les coordonnées polaires (r,y). Montrer que le 
lagrangien du systéme est donné par : 


L=} m{r?+r?g7}-V(r). 


Ecrire les équations du mouvement et en déduire la seconde loi de Kepler. 
(iii) Montrer que I’ énergie de la particule peut se mettre sous la forme 


AD 2 "Je 
E= 5m + t Vir). 
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(iv) Discuter de la nature des trajectoires selon les valeurs de E dans le cas où V(r)=—const./r. 
(v) Dans quels cas les trajectoires sont-elles des ellipses? Montrer que le paramètre p et 
l’excentricité de ces ellipses sont donnés par 


2 =, h4 2E 
P=mxconst. > $F ealon) 


9. Soit p(x) la densité de masse attachée à un corps de masse totale M. 
(i) En utilisant la solution formelle de l’équation de Poisson pour le potentiel gravitationnel y(x), 
montrer que cette dernière grandeur peut s’écrire sous la forme 


(x) = -GM -G D Qu wg +. 
ij 


(développement multipolaire) où les coordonnées x (i=1,2,3) ont pour origine le centre de gravité de 
la distribution de masse. Q:; est une matrice 3x3, le tenseur quadrupolaire. 

(ii) Comment Q;; est-il modifié lorsqu’au lieu de situer l’origine des coordonnées au centre de 
gravité du système, on la situe en un point arbitraire? Que devient l’expression précédente pour p? 

(iii) Comment s’ écrit y(x) lorsque p(x) est à symétrie sphérique ? 

(iv) Comment s’écrit p(x) pour un corps massif dont tous les moments multipolaires sont nuls 
sauf le terme quadrupolaire? Donner l'expression correspondante pour la force de gravitation. 

(v) Application : Le Soleil étant en rotation (Tœ 25 jours), son diamètre à l’équateur est 
légèrement supérieur à son diamètre polaire (le Soleil est donc légèrement aplati), et possède donc un 
moment quadrupolaire non nul. Expliquer pourquoi. Dans la suite, on supposera que tous les moments 
multipolaires du Soleil, supérieurs au quadrupolaire, sont nuls. 

(a) Quelles sont les composantes non nulles de Q:;, le Soleil possédant la symétrie 

cylindrique? 

(b) On considère maintenant un corps massif qui se meut dans le plan équatorial du Soleil et 
orthogonal à laxe de rotation de celui-ci. Donner I’ expression de la force due au Soleil et agissant sur ce 
corps. Quelle est l’énergie potentielle associée? Quel effet produit—elle sur le corps (qualitativement) ? 

(c) On pose 


J2 = -Qss / (2MoRo”), 


et l’on donne 


J2 =2.5x10 5, Mo = 2x10? g , Ro = 7X10!° cm 
Evaluer l’ordre de grandeur de l’avance du périhélie de Mercure dû à cet effet (on pourra utiliser 
des considérations énergétiques). On donne encore (concernant Mercure) : 
distance du périhélie : 4.6x 10? cm, période : .24 années 
eccentricité de l’orbite : .21. 
Comparer avec le résultat que donnerait la mécanique classique [L. Landau, E. Lifschitz, Mécanique}. 


10. On considère une planète de masse m soumise à l’action du potentiel V(r)=—-GMom/r. Elle 
possède un mouvement elliptique. On perturbe maintenant ce mouvement à l’aide d’un “petit” potentiel 
e(r) : “petit” signifie 


Le potentiel auquel est soumise la planète cesse donc d’être en 1/r et la trajectoire s’ouvre légèrement : 
le périhélie de la planète varie alors d’une valeur 6 à chaque révolution, valeur que l’on se propose de 
calculer dans cet exercice. 


(i) En intégrant l'intégrale première du moment cinétique et en tenant compte de la relation de 
conservation de l’énergie, montrer que 


= pa = Jdr 
Ave=(e—v0)= J 7 {2m[B—V(r)—e(r)|—J2/r2 2 ? 
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où r varie de rmin à Tmax, Valeurs qui annulent le dénominateur. Pourquoi a-t-on 69=2Ay? 
(ii) Montrer que l’on a encore 


6y= —2 [7 dr{2m[E-V(r)-e(r)]- Try 


(iii) Calculer alors Sy, la variation du périhélie de la planète, à l’ordre 1 en e(r}. 
(iv) Application : (a) e(r)=8/r?, (b) e(r)=y/r%. [L. Landau, E. Lifschitz, Mécanique] 


11. On considère une planète en orbite circulaire autour du Soleil et l’on suppose que la constante 
de gravitation G varie très lentement au cours du temps. Soit R le rayon de l’orbite et Q la vitesse 
angulaire de la planète. 


(i) Que signifie “très lentement”? Préciser. 
Gi) Montrer que le rayon de l'orbite varie comme 


1 dR _ __1 dG 
R dt 7 Gd’ 


tandis que la vitesse angulaire de la planète est telle que 


1 dQ _ 2 dG 
Q dt Gdt: 
Gii) On admet que G~*dG/dt~10—"? par an. Trouver la variation du rayon de l'orbite terrestre 
en 10% ans, 10° ans, 10° ans, ainsi que la variation de sa période de rotation autour du Soleil. 
(iv) Aprés 25 ans de mesures de réflexions d’un faisceau laser sur la Lune, la distance Terre-Lune 
est connue avec une précision inférieure au centimètre. Combien de temps faut-il attendre, si l’on 
souhaite mettre en évidence une variation |AG/AT.G| de l’ordre de 10711? 


12. On considère deux masses m1 et mg orbitant circulairement l’une autour de l’autre avec la 
vitesse angulaire w. Calculer le moment quadrupolaire de ce système. 


13. Même question que dans l’exercice précédent lorsque m1 >m2 et que l'orbite de m2 est 
elliptique du fait de l’interaction gravitationnelle. 


14. Soient deux masses égales m, en interaction par l’intermédiaire d’une force F—-—k|xr1-x2|, et 
en mouvement le long d’un axe Oz. Calculer le moment quadrupolaire de ce système. 


CHAPITRE 2 


L’espace-temps de Minkowski 


Nous avons déja indiqué les principaux faits expérimentaux qui marquent la 
genése de la théorie de la Relativité Restreinte : mesure d’une vitesse finie pour 
la lumière, impossibilité de mettre en évidence |’ existence de l’éther par des effets 
du premier ordre en v/c et enfin, impossibilité de cette mise en évidence par 
des effets du second ordre (expériences d’Abraham Michelson). A côté de ces 
apports expérimentaux, les discussions théoriques sur la notion d’éther, sur la non- 
invariance des équations de Maxwell [H. Poincaré (1904)] dans le groupe de Galilée, 
la théorie de l’électron de Lorentz [D. Bohm (1965)], les critiques d’E. Mach des 
fondements de la mécanique, ont contribué puissamment à l’élaboration des idées 
d’Einstein [S. Feuer, (1980)]. 

Il faut cependant se rendre compte que les idées classiques (i.e. prérelati- 
vistes) n’ont pas été abandonnées sans qu’aient été épuisées toutes les possibilités 
d’explication dans le cadre d’idées admis à la fin du XIX® siècle. Par exemple, 
Fitzgerald et Lorentz proposèrent, indépendamment, d’expliquer le résultat néga- 
tif de l’expérience de Michelson par une contraction du bras de l’interféromètre, 
parallèlement à la vitesse, un effet dû à l’éther : 


L = Loy/1-v?/e2. (2.1) 


Toutefois, si la contraction de Fitzgerald—Lorentz constitue bien une explication 
possible, cet effet physique de 1’ éther implique aussi que l’indice de réfraction d’un 
solide, la résistance d’un fil conducteur, la fréquence de vibration d’un barreau 
de quartz, etc., soient modifiés en raison du mouvement par rapport à l’éther. 
Des expériences furent effectuées [M.A. Tonnelat (1971)] et leurs résultats furent 
négatifs. Pour expliquer ces résultats négatifs, Lorentz était amené a faire une 
hypothése supplémentaire, 4 savoir que la masse des corps variait avec leur vitesse 
par rapport à l’éther : 


maesi (2.2) 


VIZ 
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Lorentz montrait alors que les horloges devaient étre ralenties dans le rapport 


To 
Jl — v/e 


(To : période de l’horloge) ce qui, avec la contraction des longueurs (2.1), conduit 
facilement à une vitesse de la lumière indépendante de celle de l’observateur 
par rapport à l’éther. Cependant, les horloges étant ralenties et les longueurs 
contractées, la notion de simultanéité nécessitait une analyse délicate, quoique 
quelque peu artificielle, qui conduisait aux transformations de Lorentz (trouvées 
indépendamment par Voigt, et par Poincaré également) : 


T= (2.3) 


y anvi 
Vi -v/e 
p =- BS v.x/c? (2.4) 


J1—v2/c2 


Ces transformations laissaient les équations de Maxwell invariantes, et la vitesse 
de la lumiére constante. La théorie de Lorentz fournissait donc une explication des 
divers résultats expérimentaux. Par contre, en distinguant les “vrais” temps et les 
“vraies” distances (c’est-à-dire, ceux relatifs à l’éther) des temps et des distances 
liés à l'observateur (en mouvement par rapport à l’éther), la théorie de Lorentz 
comportait une ambiguïté fondamentale que l’expérience ne pouvait, encore une 
fois, lever puisque précisément, l’éther demeurait toujours inobservable! Mais, 
bien qu’inobservable, il conservait cependant un rôle tout à fait central, notamment 
dans l’interprétation par Lorentz (et aussi par Poincaré) de la transformation (2.4), 
interprétation (1904) complètement différente de celle d’Einstein (1905). 

C’est, en fait, le rejet d’un éther inobservable et la critique de la notion 
de simultanéité — notion sans problème et allant de soi pour les physiciens 
prérelativistes — qui vont conduire Einstein à la théorie de la Relativité Restreinte 
(1905), théorie qui apparaîtra bientôt [H. Minkowski (1908)] comme une théorie 
de la liaison mutuelle de l’espace et du temps. 

Cette théorie est basée sur les deux postulats suivants : 

(i) Dans le vide, la lumière se propage avec une vitesse constante c, dans tous les repères 
galiléens et ce, indépendamment du mouvement de la source et de l’observateur. 


(ii) Aucune expérience physique interne ne peut mettre en évidence le mouvement d’un 
système de référence galiléen par rapport à un autre système de référence galiléen. 


Le premier postulat — celui de la constance de la vitesse de la lumière — recouvre 
toute une série d’expériences et de mesures diverses [M.A. Tonnelat (1971)], dont 
nous ne parlerons pas ici. Le second postulat constitue l’extension du principe 
de relativité galiléen à tous les phénomènes de la physique, donc y compris aux 
phénomènes électromagnétiques, et non plus aux seuls systèmes mécaniques. Ce 
postulat fondamental, dont nous n’avons énoncé que l’aspect physique, comporte 
également un aspect descriptif : 
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Gi)’ Toutes les lois de la physique ont la même forme dans tous les systèmes inertiels. 


Cet aspect descriptif s’explique aisément en remarquant que deux formes différentes, dans deux 
repères inertiels, pour les équations régissant un phénomène physique, entraîneraient la mise en 
évidence du mouvement relatif des deux repères. Ainsi, si la seconde loi de Newton F=m est 
vérifiée dans un premier référentiel inertiel, et si dans un autre tel référentiel elle prend la forme 


F=my+T, 


le terme I” peut être interprété comme étant une force supplémentaire que l’on peut, en principe, 
mettre en évidence. 


La conséquence la plus immédiate de ces postulats sera que les transformations 
qui font passer d’un système d’inertie à un autre devront nécessairement conserver 
les équations de l’électromagnétisme, 2. e. les équations de Maxwell, les expériences 
d’optique étant — et de loin — beaucoup plus précises que celles portant sur 
des systèmes mécaniques. Il s’ensuivra alors que les équations de la mécanique 
newtonienne (qui sont invariantes dans le groupe de Galilée et non dans celui de 
Lorentz) n’auront plus la même forme dans des systèmes galiléens différents : 
il sera donc nécessaire de les modifier afin qu’elles satisfassent au principe de 
relativité d’ Einstein (ii)’, puis de vérifier expérimentalement que les conséquences 
des nouvelles équations sont bien réalisées dans la Nature. 


L’espace-temps de la Relativité Restreinte 


L'existence d’une vitesse universelle, la vitesse de la lumière, va profondément 
modifier la structure de l’espace-temps, aussi bien en le munissant d’une métrique 
(ou, plus précisément, d’une pseudo—métrique 1) définie par une forme quadra- 
tique, qu’en changeant la nature des objets géométriques qui lui sont attachés in- 
trinsèquement. C’est cet espace-temps — qui comporte toujours quatre dimensions — 
avec ses structures nouvelles, que nous appellerons espace-temps de Minkowski 
(1908) et que nous désignerons par M . 

Considérons donc deux systèmes d'inertie caractérisés par des coordonnées 
d’espace-temps (t,x) et (t’, x’), et examinons la propagation d’une onde lumineuse 
sphérique à partir d’un point O de Mt . Nous supposerons, en outre (et cela ne 
restreint aucunement le raisonnement ci-après), qu’à t = t = 0 les deux systèmes 
d'inertie coincident [1.e. l’origine O est la même pour les deux systèmes : (t = 0, 
x = O)et (t’ = 0,x’ = 0) représentent bien le même point de M ]. 

Dans le premier système de référence, l’onde lumineuse se trouve à la distance 
|x| de O au temps t, c’est-à-dire 


et? — x? = 0. (2.5) 
1. Il s’agit, comme on le verra par la suite, d’une pseudo-métrique car la forme quadratique définie sur 


l’espace-temps de ia relativité n’est pas définie positive. En fait, ii vaudrait mieux dire “en le munissant 
d’une structure lorentzienne”. 
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Dans le second système d’inertie, la même onde lumineuse apparaît également 
sphérique en vertu du principe de relativité d’Einstein (ii) et, de plus, sa vitesse est 
également c en vertu du postulat (i). Il s’ensuit que, dans ce système, la distance 
parcourue par l’onde lumineuse au bout du temps t’ apparaît également comme 
étant 

et? — x? = 0, (2.6) 


Quelles conséquences peut-on en tirer? I] faut remarquer d’abord que la relation 
(2.5) [ou la relation (2.6)] définit dans Wt une variété à trois dimension — une 
surface à trois dimensions — qui est un cône d’origine O. Ce cône s’appelle le 
cône de lumière [Fig. 2.1] ou encore cône isotrope. Cela étant, l’ identité formelle 
des relations (2.5) et (2.6) — l’une étant obtenue à partir de l’autre à l’aide des 
changements de coordonnées associés aux changements de système d’inertie — 
montre que le cône de lumière reste le même, reste invariant dans les changements 
de systèmes de référence galiléens : deux observateurs inertiels constatent que la 
lumière se propage de la même façon pour chacun d’entre eux; le cône de lumière 
leur apparaît comme un objet géométrique de l’espace-temps de Minkowski. 


Figure 2.1 : Le cône de lumière dans l’espace de Minkowski. 


En outre, comme les propriétés d’homogénéité spatiale et d’uniformité de 
l’écoulement du temps subsistent, il apparaît que chaque point de M peut être 
considérée comme le sommet d’un cône de lumière. 

Le cône de lumière possède deux nappes, la nappe du futur, qui représente l’expansion dans l’espace 

et le temps à partir de O d’une onde lumineuse sphérique, et la nappe du passé, laquelle est engendrée 

par l’ensemble des rayons lumineux parvenant en ©. On peut également considérer la nappe du futur 


comme étant engendrée par tous les rayons lumineux possibles issus de O : les génératrices du cône 
sont les droites d’équation 


æ=nct (2.7) 
où n est un vecteur unitaire quelconque (n?=1) de R°. 


Les cônes de lumière présents dans l’espace-temps vont jouer un rôle considéra- 
ble dans les développements ultérieurs de Ja relativité. En particulier, ils vont 
permettre de munir Wt d’une métrique, comme nous allons le voir ci-dessous. 
Cependant, en plus des cônes de lumière, il existe une autre classe d’ objets géométri- 
ques, représentant les mouvements inertiels, les droites. Nous verrons toutefois que, 
contrairement au cas newtonien, toutes les droites ne correspondent pas à des mou- 
vements inertiels observables, mais seulement celles qui sont situées à l’intérieur 
d’un cône de lumière. 
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Si l’on considère des coordonnées cartésiennes (t, x) dans M (sur la figure 2.2, seules deux 
dimensions d’espace ont été indiqués, par souci de clarté) la droite x = 0, i.e. l’axe Ot, représente 
un mouvement inertiel {K}. Cette droite apparaît sur la figure 2.2 comme un axe de symétrie du 
cône d’équation c?t?—x?=0. Un autre système inertiel { K’} animé d’une vitesse v par rapport à 
{K} sera représenté par une droite qui n’apparaît pas sur la figure comme un axe de symétrie du 
cône de lumière. Y a-t-il violation du principe de relativité, {K } et {K’} ayant, en apparence, des 
propriétés différentes dans leur relation au cône isotrope ? Evidemment, il n’en est rien. En fait, c’est 
notre représentation euclidienne d’un espace non euclidien qui est en cause : elle est inadéquate et 
ne peut traduire toutes les propriétés de IN . En fait, aussi bien la droite {K} que la droite {.K’}, ou 
d’ailleurs toute autre droite passant par le sommet du cône et située dans {T°}, est bien un axe de 
symétrie. Pour cette raison, et par analogie avec le cas de la sphère usuelle dont toute droite qui passe 
par le centre est un axe de symétrie, on appelle parfois le cône de lumière pseudosphère [J.L. Synge 
(1958)]. 


iT} 


cône de : 
lumière 


espace 


Figure 2.2 : Axes temporels du cône de lumière. Le cône de lumière n'a pas d’axe de symétrie 
privilégié; tout mouvement inertiel — tels ceux dénotés par {K} et {K'} — peut légitimement être 
considéré comme un axe de symétrie du cône {T}. 


Nulle part on ne voit apparaître, comme conséquence des principes de constance 
de la vitesse de la lumière et de la relativité d’ Einstein, de 3-plans : dans l’espace 
de Minkowski les seuls objets géométriques ayant un sens physique direct, qui 
ne relèvent ni d’une définition, ni d’une convention, sont les cônes de lumières et 
une classe de droites qui sera précisée plus loin. Certes, on peut encore feuilleter 
l’espace-temps avec des familles de 3—plans parallèles coupant tout axe de temps; 
néanmoins un tel feuillage est non seulement arbitraire mais encore ne s’impose 
aucunement. 

La conséquence la plus importante de cette structure particulière de l’espace- 
temps de la Relativité Restreinte réside dans le fait qu’elle y induit une métrique 
pseudo-euclidienne, qui s’écrit ? 


ds? = c? dt? — dx?. (2.8) 


2. On trouve également la convention ds?—dx?-—c?dt?. En posant 2*=ict, on peut alors écrire 
ds*=+[dxy +dzo ?+dx3 ?+dxa 2], le signe dépendant de la convention adoptée. Les transformations 
linéaires telles que ds?=ds’? sont alors, formellement, des rotations de R*, dont un “angle” est 
imaginaire pur. | 
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Cette métrique posséde la propriété fondamentale d’étre invariante dans les 
changements de coordonnées galiléennes; autrement dit, si (t’, x’) désigne d’ autres 
coordonnées cartésiennes attachées à un autre référentiel galiléen, on aura 


ds? = ds? (2.9) 


ou encore 


e dt? — dx? = © dt? — dx”. (2.10) 


Les propriétés (2.9) et (2.10) sont satisfaites pour ds?=0, on l’a déjà vu plus haut (ds?=ds’?=0 
exprime seulement la constance de la vitesse de la lumière). Montrons que ces relations sont vraies 
généralement. Si l’on effectue un changement de coordonnées cartésiennes (t,x)— (t,x), on obtient 
alors 


ds? = f(t',x’ ; v) ds’? (2.11) 


où f est une fonction, pour le moment arbitraire, des positions d’espace-temps et de la vitesse relative 
des deux systèmes inertiels. En fait, l’homogénéité de l’espace et l’uniformité de l’écoulement du 


temps impliquent que f ne dépende ni de t’ ni de x’ En outre, si v=0 on doit avoir f(0)=const.=1. 
Si l’on effectue maintenant la transformation inverse, on devra avoir 


ds? = f(—v)f(+v) ds? (2.12) 


et l’on aura donc 
f(-v)f(+v) = 1. (2.13) 


Mais comme f ne peut dépendre de v (isotropie de l’espace) que par l’intermédiaire de |v|/c, 
cela implique que f=1. Dans tout ce raisonnement nous avons supposé implicitement que tous les 
observateurs galiléens utilisent les mêmes unités de temps et de longueur. 

Notons enfin que la forme quadratique (2.8) ne définit pas une métrique sur M 
mais seulement une pseudo—métrique : ds? peut avoir n’importe quel signe et, de 
plus, s’annule pour des dt? et dx? non nuls. 

Nous verrons également, dans la suite, que |’ existence de cette forme quadratique 
invariante dans les changements de systémes. inertiels définit aussi la structure 
causale de M . En outre, elle donne à la définition physique de la simultanéité, à 
la définition d’Einstein, un sens absolu : en tout point un observateur ne pourra 
jamais observer, à l’aide d’ondes électromagnétiques, que les événements qui se 
sont produits sur la nappe du passé de son cône de lumière; et ces événements lui 
apparaîtront comme simultanés. 


La transformation de Lorentz 


Il existe de très nombreuses démonstrations de la transformation de Lorentz 
(2.4), c’est-à-dire des formules de passage d’un système d’inertie à un autre qui 
préservent la structure mathématique de l’espace-temps. Celle qui est donnée ci- 
dessous n’est pas forcément la plus simple : elle présente cependant l’avantage 
d’être assez instructive. 
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Nous sommes donc amenés à rechercher des transformations linéaires [elles 
doivent transformer un mouvement inertiel en un autre mouvement inertiel; en fait, 
cette linéarité peut également être démontrée à partir de l’homogénéité de l’espace 
de Minkowski (c’est-à-dire de l’homogénéité de l’espace et de l’uniformité du 
temps)] qui laissent invariants les cônes de lumière. 


On peut montrer que les transformations les plus générales qui laissent invariant le cône de lumière 
sont les transformations conformes, qui comprennent, outre les transformations de Lorentz, les 
transformations non linéaires suivantes : 


t = [e - (2t - x? )a°|/N 
E E (2.14) 


N =1- 2(cta° — a.x) + (a°? _ a?) (2t — x?) 


où a est un vecteur constant et où a? est une “constante” 3. De plus, les changements d'échelle 
préservent également le cône de lumière : 


t'= xt, x’ = Ax. (2.15) 
Toutes ces transformations forment un groupe continu à 15 paramètres. 


Posons maintenant 


ct 
£ 


(nous considérons désormais une seule dimension spatiale, ce qui permettra de 
simplifier beaucoup les calculs, sans toutefois altérer la physique sous-jacente) et 


X= , X= (2.16) 


1 0 
G = 0 -1 (2.17) 
Nous cherchons donc les transformations linéaires L, 
X’ = LX (2.18) 
où 
foo Loi 
L= 2.19 

Lio bu (2:29) 


qui préservent le cône de lumière, dont l’équation [cf. Eq. (2.5), (2.6)], compte tenu 
des notations ci-dessus, se réécrit 4 


XTGX = 0 
(2.20) 
XTGX'=0 


3. En fait, il s’agit de la composante 0 d’un quadrivecteur (voir plus loin). 
4. T désigne la transposée. 


50 L’espace-temps de Minkowski 
La seconde de ces dernières équations se réécrit encore 


XTLTGLX =0, (2.21) 


qui doit être valable quel que soit X, satisfaisant à la première des équations (2.20). 
Dans ces conditions, il n’est pas très difficile de montrer que les équations (2.20) 
et (2.21) entraînent l’égalité matricielle 


LTGL =)G, (2.22) 


(où À est un paramètre caractéristique d’un changement d’unités d’un observateur 
à l’autre et que nous pouvons toujours prendre égal à 1) caractéristique des 
transformations L que nous cherchons; cette dernière relation, après avoir été 
multipliée à gauche par XT et à droite par X, implique que 


OP — x = di — 2°, (2.23) 


équation équivalente à l’équation (2.9) [et (2.10)] concernant l’invariance de la 
métrique de M. 

Notons encore que, parmi les solutions particulières de l équation (2.22), on 
trouve également 


—1 0 


ol 


(2.24) 


1 0 
0 -1 
qui représentent respectivement les renversements du temps et les retournements 
d'espace (parité). 

Les transformations de déterminant +1 s’appellent les transformations de Lo- 
rentz propres; les autres sont appelées impropres. De même, celles qui sont telles 
que foo > 0 sont dites orthochrones, les autres (i.e. telles que Zoo < 0) sont dites 
antichrones. Comme l’identité fait partie des transformations propres, toutes les 
transformations engendrées continûment à partir de l'identité sont également des 
transformations propres. Les transformations orthochrones possèdent la propriété 
de ne pas changer le sens de l’écoulement du temps lorsqu’on passe d’un système 
d’inertie à un autre. 

Limitons—nous donc aux transformations propres et orthochrones; pour résoudre 
l’équation (2.22), il suffit de la mettre sous la forme 


LTG = GL}, (2.25) 


qui constitue un système linéaire pour les éléments de matrice de L, lequel se résout 
facilement compte tenu de ce que dét.L = +1. La condition £99 > 0 permet alors 
de mettre les matrices L sous la forme 


L(6) = (2.26) 


ch@ shé 
sh@ chôl’ 
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Le paramètre doit maintenant être relié à la vitesse relative des deux systèmes 
inertiels. On trouve que 


thé = —v/c. (2.27) 


es changements de coordonnée: iléennes s’écrive 
Les changements d données galil z nt 


t =tch@+a/csh@ 
(2.28) 
z! =ach0+ctsh@, 


de sorte qu’un point immobile dans le second système d’inertie, par exemple x’=0, se meut à la 
vitesse v = æ/t dans le premier système. Ceci entraîne la relation (2.27). 


Utilisant maintenant la relation (2.27) en l’insérant dans l’équation (2.26), il 
vient 


| | (2.29) 


LW) = -= 

Aare 

c’est-à-dire les transformations de Lorentz “pures’ 
“boosts”). 

Dans le cas précédent, où il n’y avait qu’une dimension d’espace, le groupe de 
Lorentz était un groupe à un paramètre (v). Dans le cas général, le groupe de Lorentz 
est un groupe à six paramètres (v et trois paramètres de rotation) non abélien (non 
commutatif). 


1 —v/c 
—v/c 1 


$ 


ou “restreintes” (2.4) (les 


Remarques 


1. Considérons d’abord deux transformations de Lorentz différentes L(01) et 
L(02). On vérifie facilement que 


L(0:).L (02) = L(0, + 02) (2.30) 


à l’aide des formules d’addition des sinus et des cosinus hyperboliques. Utilisant 
la relation (2.27) ci-dessus, qui relie v et 9, il vient 
w = Vt (2.31) 
1+ v2 v2/c? 
qui constitue la loi d’addition des vitesses (paralléles) de la Relativité Restreinte 
(w correspond à 6; + 02 ; v1 à 01 et v2 à 02). Cette relation montre que si l’une des 
deux vitesses vı ou v2 est égale à la vitesse de la lumière, w est aussi égale à c; ce 
qui était attendu a priori puisque, précisément, cette constance de la vitesse de la 
lumière était postulée ab initio. 
Une autre conséquence de la loi d’addition (2.31) est que la vitesse de la lumière 
apparaît comme une vitesse limite pour un système inertiel : si un système de 
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référence galiléen possède initialement une vitesse v < c, il ne pourra jamais 
dépasser c; on aura beau lui faire acquérir une vitesse supplémentaire, sa vitesse 
résultante w [Eq. (2.31)] restera toujours inférieure à la vitesse de la lumière. 
Cette remarque n’implique absolument pas que la relativité interdise les vitesses 
supérieures à celle de la lumière [E. Recami et al. (1974)]; elle implique seulement 
ques les droites de M se divisent en deux catégories, les droites du genre temps ° 
situées à l’intérieur des cônes de lumière [Fig. 2.3] et les droites du genre espace Ê, 
qui se trouvent à l’extérieur de ces cônes; de plus, ces deux familles sont totalement 
disconnectées et l’on ne peut passer de l’une à l’autre par une transformation 
de Lorentz : seules les droites du genre temps correspondent à des mouvements 
inertiels conformément à l’expérience (et non pour des raisons de nature théorique); 
les droites du genre espace correspondent, elles, à des mouvements rectilignes et 
uniformes, à des vitesses supérieures à la vitesse de la lumière, mouvements que 
l’on n’observe pas actuellement. 

2. L'existence du paramètre additif 0, qui apparaît dans L(0}, va maintenant 
permettre la construction explicite d’une véritable géométrie (pseudo-) métrique 
[I.M. Yaglom (1979)] sur M . Ainsi, étant donnés deux systèmes inertiels (a) et 
(b) [Fig. 2.4] animés l’un par rapport à l’autre d’une vitesse v, on appellera “angle” 
des deux droites représentatives, dans l’espace—temps, le paramètre 0 associé à v. 
Cet angle possède bien une signification intrinsèque en ce sens qu’il ne dépend 
que de la situation relative des deux droites. Il n’en était pas ainsi dans le cadre de 
l’espace-temps classique. De même, si l’on considère trois observateurs inertiels, 
(a), (b) et (c), on aura 


Bac = Gab + Ore (2.32) 


où la notation est évidente. 

On comprend désormais mieux l’affirmation selon laquelle tout mouvement 
inertiel peut être considéré comme un axe de symétrie pour le cône de lumière. 
En effet, l’angle compris entre toute droite du genre temps et le cône isotrope est 
infini : lorsque v — c, 0 — oo [cf. Eq. (2.27)]. Nous reviendrons plus loin sur la 
géométrie de M. 

3. Il est facile de se rendre compte que lorsque v < c, les transformations 
de Lorentz (2.4) se réduisent à des transformations de Galilée pures. Toutefois, la 
question qui se pose est plutôt : que deviennent les structures mathématiques de 
l’espace de Minkowski et, notamment, celle constituée par des cônes de lumière ? 

En fait, on peut voir facilement qu’un cône isotrope dont le sommet se trouve 
au point de coordonnées (galiléennes) (to, Xo) a pour équation 


CGH? — (x- x? = 0, (2.33) 


5. Qui représentent des mouvements rectilignes et uniformes à vitesse v<c. 
6. Qui représenteraient des mouvements rectilignes et uniformes à vitesse v>c. 
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droite du genre 


“temps 
i 
J | 
a droite du genre 
espace 
—_———P 
espace 


(a) 


droite du 
genre temps 


temps 


droite du 
cône genre espace 


isotrope 


espace 


(b) 


Figure 2.3 : Différents genres de droites dans l’espace-temps. (a) Une droite est du genre temps s'il 
existe un cône de lumière qui la contienne entièrement. Une droite est du genre espace si elle est située 
à l'extérieur de tout cône de lumière dont le sommet s’y trouve situé. Une droite est isotrope (ou du 
genre lumière) si elle constitue une génératrice du cône de lumière. (b) La pente d’une droite du genre 
temps représente l'inverse de la vitesse d’un sytème inertiel asocié, relativement au système inertiel lié 
aux coordonnées (t,x). Elle est donc supérieure à c7? (pente des génératrices du cône isotrope) : une 
droite du genre temps représente donc bien un mouvement inertiel effectué à une vitesse inférieure à la 
vitesse de la lumière. Au contraire, une droite du genre espace représenterait un mouvement effectué à 
une vitesse supérieure à c. 


de sorte que lorsque c — co, ce cône s’aplatit de plus en plus, tant et si bien qu’à 
la limite, il se réduit au 3-plan ¢ = to. Finalement, à cette limite, tous les cônes 
isotropes se réduisent aux 3—plans t = const. de l’espace-temps classique, Au fur 
et à mesure que les cônes s’aplatissent, ils incluent de plus en plus de droites, de 
sorte qu’à la limite, toute droite passant par le sommet d’un cône devient une droite 
du genre temps : à la limite classique, toute droite qui coupe un plan spatial est 
du genre temps, résultat que l’on retrouve bien par passage à la limite c — oo. 
En fait, à cette limite, les seules droites du genre espace existantes sont les droites 
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(b) (c) 


Figure 2.4 : Angle hyperbolique de deux droites du genre temps. (a) L’angle hyperbolique 6 des deux 
droites (a) et (b) est lié de manière univoque à la vitesse relative des deux mouvements inertiels associés 
par la relation th 6 = -v. (b) Le passage du mouvement inertiel (a) au mouvement inertiel (c) peut 
toujours être effectué par l'intermédiaire d'un troisième mouvement inertiel (b) : c’est l’additivité des 
angles hyperboliques (@ac=@ab+9oc) qui constitue la loi d’additivité des vitesses dans le cas relativiste. 
(c) L’angle hyperbolique entre une droite du genre temps quelconque et une génératrice du cône de 
lumière est toujours infini : toute droite du genre temps fait le même “angle” avec le cône isotrope et 
peut donc être considérée comme un axe de symétrie pour ce dernier. 


contenues dans des 3-plans t = const. et qui correspondent à des propagations à 
vitesse infinie. 

4. Etant donnés deux points M; et M: de M, on peut toujours former un vecteur, 
à quatre composantes, dont la (pseudo—)longueur sera donnée par 


MM = e (te —t1)” — (x -x) (2.34) 


= XTGX (2.35) 


où X est la matrice représentative de Mı M dans le repère galiléen. Le vecteur 
M: M sera dit du genre temps si Mı M ? > 0, du genre espace si M, M2? < 0 
et isotrope lorsque Mı M 2 — 0. Autrement dit, le genre de Mı Mz est le même 
que celui de la droite qui passe par M; et Mo. 


Si (t1,x1) et (t2,x2) sont les coordonnées galiléennes des points M, et Mz respectivement, le 
vecteur Mı M2 aura pour composantes [(t2~t1) , (x2—x1)]. 
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Comme la forme quadratique (2.34) est conservée par changement de coor- 
données galilénnes, 


2 2 
tt) — (ox) = P (t-t) — (x), (2.36) 
il s’ensuit que l’on a aussi 


tite — x2x1 = bit — xx. (2.37) 


Ceci nous permet alors de définir un (pseudo—)produit scalaire invariant dans 
les changements de systèmes d’inertie, par 


MM.MM3 = XTGY. (2.38) 


Dans un autre système d’inertie, on aura 


X'=LX et Y'=LY (2.39) 
et 
XTGY! =XTITGLY 
(2.40) 
=XTGY 


en vertu de la relation (2.22). 


Avec ce produit scalaire, on définira dans M l’orthogonalité (en fait, la pseudo- 
orthogonalité) de deux vecteurs par 


XLY 4> XTGY =0 (2.41) 


où X et Y sont les matrices représentatives de Mı M et Mı M3. 


Causalité et simultanéité 


Revenons à l’espace de Minkowski et à sa structure géométrique, voire topolo- 
gique. Chaque cône de lumière permet de partager l’espace-temps en trois régions 
et deux frontières [Fig. 2.5]. On trouve, d’une part, les deux régions situées à 
l’intérieur de chacune des deux nappes du cône isotrope et, d’autre part, la région 
qui se trouve à l'extérieur du même cône. 

Pour caractériser plus précisément ces trois régions — pour leur donner un sens 
physique — il convient de fixer une orientation des cônes de lumière de l’espace- 
temps. Pour cela, considérons un observateur inertiel; sa trajectoire dans M est une 
droite du genre temps (située à l’intérieur du cône isotrope) orientée dans le sens 
de l'écoulement du temps. Notons, incidemment, que cette orientation doit être la 
même pour tous les systèmes inertiels dont les trajectoires d’espace-temps passent 
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futu 


Figure 2.5 : (a) Chaque cône de lumière partage l’espace-temps en trois régions : le futur, à l'intérieur 
de la nappe T*; le passé, à l’intérieur de la nappe T”; et l’ailleurs, à l'extérieur du cône. (b) Un 
cône T'(M,) étant orienté, tous les autres cônes isotropes T'(M.) le sont également, de manière que 
Phomogénéité de l’espace-temps soit préservée. 


par le même point O; il s’agit 14 d’une condition de cohérence minimale (tous les 
observateurs galiléens doivent voir le temps s’écouler dans le même sens) qui est 
préservée, par construction, par les transformations de Lorentz orthochrones. T+ 
désignera donc la nappe du futur, c’est-à-dire celle qui correspond au sens positif 
de l’écoulement du temps pour tout observateur galiléen (dont la trajectoire passe 
par son sommet. I’~ désignera la nappe du passé, c’est-à-dire l’autre nappe. Un 
cône de lumière quelconque étant ainsi orienté, tous le seront également si l’on 
impose que cette orientation est préservée par les translations d’espace-temps. Il 
s’ensuivra que, dans tous les systèmes d’inertie, le temps s’écoulera de la même 
façon. 

Notons que les transformations de Lorentz pures, ou restreintes (2.4), conservent aussi bien le sens de 


l'écoulement du temps pour les différents observateurs inertiels, que les différentes régions indiquées 
plus haut. En effet, dans un système de coordonnées galiléennes quelconque (+, x), on a 


Int.r+ = {(t,x) : c?t? — x?>0,t>0} 
Int. = {(t,x) : °t? — x?>0,t<0} 
Ext.” = {(t,x) : °t? — x?<0 }. 


Or, toute transformation de Lorentz conserve la forme quadratique c?t? —x? [Eq. (2.23)] et donc 
également son signe. 
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Les points d’espace-temps situés à l’intérieur de l+ (O), soit Int. l+, sont dans 
le futur de O : les événements qui se produisent en O peuvent influencer, voire 
être la cause, de ceux qui se produisent à l’intérieur de ‘+. De même, les points 
d’espace-temps situés à l’intérieur de P~ (O), soit Int., sont dans le passé de 
O : les événements qui s’y produisent peuvent avoir influencé, voire être la cause, 
de ce qui se produit en O. Quant à la troisième région, située à l’extérieur du cône 
I, l’ailleurs, elle est constituée de points totalement inaccessibles à O, car on 
n’observe pas de signaux se propageant à une vitesse supérieure à la vitesse de la 
lumière. 


Dans un système de coordonnées galiléennes quelconque, la condition 


c2t? — x2<0 


se traduit par 
x?/t >c. 


L’ailleurs n’est donc accessible qu’en utilisant des phénomènes physiques se propageant à des 
vitesses supérieures à celle de la lumière. 


Il est nécessaire de remarquer que ce dernier point — l’inaccessibilité de l’ailleurs 
à O ou, ce qui revient au même, l’inexistence d’actions se propageant à des vitesses 
supérieures à celle de la lumière — constitue un postulat supplémentaire, justiciable 
en dernière analyse d’une vérification expérimentale. Nous admettrons sa validité 
(dans un cadre non quantique). 

Dans ces conditions, un observateur galiléen [Fig. 2.6] ne peut apercevoir qu’une 
région limitée de l’espace-temps : il devra attendre un certain temps OO’ avant 
d’avoir accès à une partie de l’ailleurs de O; en quelque sorte, à chaque instant, 


Figure 2.6 : Inaccessibilité de Univers global. En O, l'observateur, ne peut observer que les 
événements situés à l'intérieur de la sphère C(O); pour avoir accès à une partie des événements 
situés à l'extérieur de C(O), dans le plan spatial S, il devra attendre d’être arrivé en O’, donc que se 
soit écoulé le temps OO’ ; ainsi, le point M est inobservable de O, mais l’est de O’. 
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il possède un horizon” [Fig. 2.7]. Autrement dit, certaines régions sont trop 
éloignées pour que la lumière ait le temps de parvenir en O. 


espace àt = 0 


Figure 2.7 : Un horizon cosmologique. Dans le cadre du modèle cosmologique dit du “big bang” 
(explosion primordiale), un observateur n'a accès qu'à une partie limitée de l'Univers (région hachurée) 
et c’est seulement avec le temps que son horizon s'élargit. 


Les cônes de lumière, orientés comme ci-dessus, définissent donc sur l’espace de 
Minkowski M une structure causale, complètement différente de celle de l’espace- 
temps newtonien déterminée, elle, par les hyperplans t = const. Cette structure 
causale détermine sur M un ordre partiel : on dira que le point M; est antérieur à 
Mb, ce que l’on écrira 


Mı <x M <> M: M: ? > 0, MM € T*(Mi) 


si, et seulement si, le vecteur Mı M est (i) du genre temps ou, à la rigueur, 
isotrope et (ii) orienté vers le futur [Fig. 2.8]. On peut d’ailleurs montrer que 
les transformations linéaires qui préservent cet ordre partiel sont précisément les 
transformations de Lorentz [E.C. Zeeman (1964)]. Au contraire, la causalité dans 
l’espace-temps newtonien constitue un ordre total. 

Venons-en maintenant à la notion de simultanéité. Si l’on se réfère à la définition 
physique de la simultanéité, celle d’Einstein, évoquée au chapitre précédent, alors 
à un instant donné de son temps, un observateur galiléen doit considérer comme 
simultanés tous les événements qui se produisent sur la nappe du passé, I~, de 
son cône isotrope. En fait, ce sont les points de l’ailleurs, sans influence de quelque 
sorte que ce soit sur l’observateur (à un instant donné), qui constituent l’analogue 
des événements simultanés du cas classique. Cependant, alors que les hyperplans 
spatiaux du cas newtonien n’ont que trois dimensions, l’ailleurs relatif à un 
observateur galiléen à un instant donné constitue un domaine quadridimensionnel. 


7. Cette question, abordée dans la plupart des ouvrages de cosmologie, le sera également dans un autre 
volume en préparation. 
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A 


(a) (b) 


M; 


(c) | (d) 


Figure 2.8 : La causalité dans l’espace de Minkowski. (a) M1<M2; (b) M2 < M1; (c) Mı et Mo 
ne sont pas comparables et ne sont pas susceptibles d'être liés causalement; (d) Mı <M2 et Max M3 
entraînent bien Mı < M3. 


Aussi la notion d’espace à trois dimensions d’événements simultanés va-t-elle, 
dans le cadre de la Relativité Restreinte, étre profondément modifiée et comporter 
un arbitraire certain. 

En derniére analyse, si l’on souhaite conserver le caractére tridimensionnel de 
l’espace, le concept de simultanéité qui émerge est celui défini par des surfaces 
du genre espace [Fig. 2.9]. Une surface du genre espace X quelconque possède 
la propriété que chacun de ses points est situé dans l’ailleurs de tout autre de ses 
points, de sorte que deux observateurs — galiléens ou non — peuvent considérer les 
points de £ comme simultanés [Fig. 2.10]. 

Il en résulte qu’un observateur galiléen peut parfaitement utiliser la notion de 
simultanéité (c’est-à-dire la ou les surfaces du genre espace) qui lui convient, 
comme par exemple celle définie par un feuilletage de l’espace-temps par une 
famille de surfaces (du genre espace), sans intersection, indexées par un paramétre 
réel [Fig. 2.11]. 

En réalité, la notion usuelle de simultanéité — c’est-à-dire celle définie par des 
hyperplans du genre espace orthogonaux à un axe de temps (au sens de la métrique 
de l’espace de Minkowski) — peut toujours être utilisée en Relativité Restreinte où 
elle est bien la plus commode. Il faut cependant garder présent à l’esprit qu’elle 
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temps 


espace 


Figure 2.9 : Surface du genre espace. Tout point de la surface X est situé dans l’ailleurs de tout autre 
point de ©. 


Figure 2.10 : Evénements simultanés. Les observateurs dont les trajectoires dans M sont dénotées 
par (a), (b), (c), . . . peuvent parfaitement considérer que les événements A, B, C, . . . sont simultanés, 
relativement à la surface du genre espace X. Sur la figure, (a) et (c) représentent des observateurs 
galiléens (lignes droites) mais non (b). 


est arbitraire et ne s’impose que pour des raisons psychologiques et de simplicité. 
Toutefois, en Relativité Générale où la notion d’observateur inertiel proprement dit 
disparaît et où l’espace-temps est courbé, il n’existe pas a priori de tel feuilletage 
par des hyperplans spatiaux; aussi la notion de simultanéité qui subsiste est-elle 
celle fournie par des surfaces du genre espace, dont on peut souvent limiter un peu 
l'arbitraire compte tenu des symétries du problème considéré. 

Dans ce cadre, où la simultanéité de deux événements — i.e. de deux points 
d’espace-temps — comporte un certain arbitraire, il en sera naturellement de même 
de leur distance spatiale [Fig. 2.12]. Examinons cela d’un point de vue “opéra- 
tionnel”, c’est-à-dire à l’aide d’une “expérience de pensée” 8 reproduisant des 
conditions expérimentales idéales. Considérons donc deux observateurs inertiels 
{K} et {K’} [Fig. 2.13] et supposons que {K} souhaite évaluer sa distance à 
{K’}. A cette fin, il envoie vers {K’} une onde électromagnétique au temps to, 
et en reçoit l'écho au temps t; (une telle expérience a effectivement été réalisée à 
l’aide d’un radar et aussi d’un laser, pour déterminer la distance Terre-Lune ou la 


8. “Gedankenexperiment”. 
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Figure 2.11 : Feuilletage de l’espace de Minkowski par une famille de surfaces du genre espace. 
L'observateur galiléen {O} peut utiliser n'importe quelle surface du genre espace X, pour définir 
l’espace à trois dimensions des événements simultanés au temps t. En outre, il peut utiliser une famille 
de telles surfaces afin d'obtenir une définition de l’espace physique qui lui convienne. 


Figure 2.12 : Distance de deux événements simultanés. La distance des événements À et B dépend 
de la notion de simultanéité adoptée. On pourrait utiliser la convention suivante : la distance de A à B 
est la plus courte considérée sur une surface du genre espace X servant à définir la simultanéité. Sur 
la figure, P représente un 3—plan du genre espace passant par A et B. 


distance des planétes; cf. Chap. 7). S’il utilise la convention usuelle de simultanéité, 
c’est-à-dire celle définie par des 3-plans de type spatial orthogonaux (au sens de 
la métrique de M) à sa ligne d’univers [la droite {K} sur la figure 2.13], il définira 
le temps t4 où se produit la réflexion du signal sur {K”} par 


fo et 
ta = oo (2.42) 


et donc sa distance à {K'}, au temps t4, par 
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t, = (tot 12 


{K} {K} 


Figure 2.13 : Mesure de la distance entre deux observateurs inertiels {K} et {K}. {K} envoie un 
signal électromagnétique vers {K'} à l'instant ta et en reçoit l'écho à t,; les deux nombres to et ti, 
joints à une conyention spécifiant la notion de simultanéité adoptée, permettent alors de déterminer une 
distance entre {K} et {K'}. La convention usuelle de la simultanéité par des 3-plans orthogonaux à la 
droite { K} conduit à définir l'instant où a lieu la réflexion de l'onde électromagnétique (point A) comme 
étant égal à (tı +to)/2, de sorte que la distance de {K} à {K'}, à cet instant, sera dy = c(t1—to) /2. 


dgg = I, (2.43) 


Notons que toute autre notion de simultanéité définie par des 3-plans du genre 
espace conduirait à un temps t4 tel que [H. Reichenbach (1958)] : 


ta = to + E(ti — to) 
(2.44) 
0 <e< 5 


| 1 
et, par conséquent, à une distance dge (£) < dx (3) ; 


Temps et distances mesurés 
par des observateurs inertiels 


Considérons encore deux observateurs inertiels (K) et (K’) utilisant chacun la 
même notion de simultanéité — celle définie par des hyperplans du genre espace 
orthogonaux à leur ligne d’univers — et ayant synchronisé leurs horloges, par 
exemple au point O de la figure 2.14. 

Supposons, en outre, que ces observateurs mesurent une longueur 9 entre deux 
points, au repos dans le système de (K) [Fig. 2.15(a)]. Pour (K) la longueur à 
mesurer, au temps ¢ = 0, est lo. Pour (K’), at’ = 0, cette même longueur est 
£ = lo/ch 0; ou encore 


l = Lo V1 — v/e. (2.45) 
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(K) (K’) 
“rt 


Figure 2.14 : Deux observateurs galiléens conventionnels, en ce sens qu'ils utilisent la même notion 
de simultanéité, celle définie par des 3-plans du genre espace orthogonaux à leurs lignes d’univers 
respectives (Kx) et (K ). A noter qu'au cours d’une transformation de Lorentz d’“angle” 6 (qui fait 


passer de (K) a (K’) }), la situation des deux observateurs par rapport au cône de lumière reste 
similaire : l'axe OP* (à une dimension spatiale) est un axe de symétrie pour tOx aussi bien que pour 
t' Oz’ ; le caractère euclidien du plan de la figure ne permet pas une représentation fidèle d'un espace 
non euclidien. 


Autrement dit, la longueur mesurée par (K’), au repos relativement à (K), lui 
apparaît plus petite : c’est le phénomène de contraction ? apparente des longueurs. 
Loin d’être un effet physique de l’éther, comme le croyaient Fitzgerald et Lorentz, 
il s’agit là d’un effet apparent [pour une discussion plus détaillée, voir M. Bunge 
(1967); M. Jammer (1979)] dû assez largement aux définitions et conventions 
utilisées par les deux observateurs quant à la notion de simultanéité. 

Venons-en maintenant à la comparaison des horloges des deux observateurs 
[Fig. 2.15(b)]. Un phénomène physique — une horloge — de durée OA dans (K), et 
situé(e) en z = 0, semble durer plus longtemps dans le système ( K’). En effet, le 
point A marquant l’achévement du phénomène possède dans (K’) les coordonnées 
(OA', OB'}etl’ona 


OA! = OAchO (2.46) 


et, si OA = to et OA’ = 1’, il vient alors 


go to (2.47) 


JEA) 


les phénomènes de (K) paraissent durer plus longtemps pour (K’) que pour (K) : 
c’est la dilatation apparente des durées, bien observée dans tous les phénomènes 
de désintégration des particules élémentaires. 


9. L’apparence visuelle des corps en mouvement a peu à voir avec la contraction des longueurs fvoir, 
par exemple, V. F. Weisskopf (1960)]. 
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trajectoires des 
extrémités de la régle 


(b) 


Figure 2.15 : (a) Contraction apparente des longueurs. £0—£ ch 9. (b) Dilatation apparente des 
durées. La durée OA d'un événement dans (K) est, dans (K'), OA'=OA ch 0>0A. 


Propriétés globales de l’espace-temps 


Les propriétés que nous venons d’étudier sont, en réalité, des propriétés locales 
en ce sens qu’elles sont liées à la métrique de l’espace de Minkowski, à des 
événements proches de l’espace-temps. Le mot “local” signifie d’ailleurs aussi bien 
l’échelle de l’atome que celle du laboratoire, du système solaire, de la Galaxie, etc. 
Bien entendu, cela reflète uniquement le caractère lui-même local des mesures ou 
des observations que nous sommes capables d’effectuer. 

Il n’est cependant nullement évident, ni sur le plan théorique ni d’un point de 
vue observationnel, que l’espace-temps ait la topologie — c’est-à-dire la structure 
globale — de l’espace de Minkowski. 


Propriétés globales de l’espace-temps 65 


Afin d'illustrer notre propos, considérons un espace-temps à deux dimensions, 
l’une de temps et l’autre d’espace. Supposons maintenant que, par la pensée, 
nous identifiions les points spatiaux, [Fig. 2.16] pour former une surface à deux 
dimensions spatialement fermée. Localement, la métrique de cet espace-temps 
est toujours celle de l’espace de Minkowski; par contre, les propriétés globales 
de l’espace-temps ont changé : les sections spatiales, auparavant ouvertes, sont 
maintenant fermées. 


Figure 2.16 : La structure globale de l’espace de Minkowski pourrait être celle d'un cylindre 
(identification des points à l'infini spatial) : dans ce cas, les sections spatiales sont fermées. 


Aucune mesure locale ne pourra nous donner d’indication sur la topologie 
de l’espace-temps. Cependant, l observation peut éventuellement apporter une 
réponse : il peut exister des galaxies [Fig. 2.17] dont la lumière pourrait nous arriver 
de deux directions totalement différentes, voire opposées; mais jusqu’à présent, un 
tel effet n’a pu être observé. Notons qu’il existe encore bien d’autres possibilités 
de structures globales où l’espace serait borné. 


=: directions dont 
= provient la lumière 


directions 
de ta lumière 
émise 


Figure 2.17 : La lumière émise par la galaxie G peut être reçue par un observateur O par plusieurs 
trajets, de sorte que G serait alors vue dans plusieurs directions. 


Une autre possibilité de structure globale pour l’espace de Minkowski à deux 
dimensions est celle où, à l’inverse du cas précédent, les points à linfini dans le 
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temps sont identifiés [Fig. 2.18]. En général, une telle possibilité est exclue par la 
causalité : nous pourrions, du moins en principe, influencer notre futur! En fait cet 
argument n’est peut-être pas aussi contraignant qu’il le semble à première vue. Si 
la périodicité temporelle [Fig. 2.19] est très grande, la possibilité d’agir sur notre 
futur est pratiquement inexistante. 


Une étude des propriétés globales de l’espace-temps de la cosmologie peut être 
trouvée dans M. Lachièze-Rey et al. (1994). 


cône de lumière 


1 direction du temps 
2 espace 


Figure 2.18 : Lorsqu'on identifie les points à l'infini temporel de l'espace de Minkowski, la causalité 
est perdue : un observateur peut influer aussi bien sur son passé que sur son futur! 


G' 


espace associé a 
l'observateur 
inertiel G’ 


espace associé à 
l'observateur H 
inertiel G 


cône de lumière O 


Figure 2.19 : Exercice 4. 


Les vérifications expérimentales 
de la Relativité Restreinte !° 


Un grand nombre de tests expérimentaux de la Relativité Restreinte ont été 
effectués, qui confirment cette théorie avec une grande précision [Tableau 2.1]. A 
cela s’ajoutent les confirmations quotidiennes de la physique des hautes énergies. 
Il n’est cependant guère facile de comparer ces diverses données entre elles, 


10. On pourra consulter l’excellent article de M.P. Haugan et C.M. Will (1987). 
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notamment en ce qui concerne leur signification théorique. Il est clair, par exemple, 
que les deux postulats énoncés au début de ce chapitre se subdivisent en une 
multitude de sous-postulats et/ou d’“évidences” expérimentales; et ce, sans parler 
de subtiles questions sur la synchronisation des horloges, la simultanéité et la part 
de convention qu’elles contiennent [voir, par exemple, H. Reichenbach (1958)]. 


Auteurs Date Effets mesurés Précision 
Brillet et al. (1979) Vent d’éther +2x10711 
Mandelberg et al. (1962) Effet Doppler transverse 5x107? 
Brecher (1977) Vitesse de la lumière 2x107? 
Grove et al. (1953) Masse relativiste 6x1074 
Alvager et al. (1964) Vitesse de la lumière 1.3x10 4 
Gviragossian et al. (1975) Vitesse d’un électron de haute énergie 2x1077 
Bailey et al. (1977) Facteur g du muon 2.7x10 7 
Van Dyck et al. (1977) Facteur g de l’électron 3.5x1079 
Wesley et al. (1971) Facteur g de I’ électron 3.5x1079 


Tableau 2.1 : Quelques-unes des mesures effectuées récemment {d’après D. Newman et al. (1978)]. 


En tout état de cause, une fois vérifiée la réalité expérimentale de tel ou tel effet 
relativiste, une fois mesurée sa grandeur, il reste difficile d’évaluer quantitativement 
la place laissée par l’expérience à une théorie alternative éventuelle : à l’heure 
actuelle, il n’existe pas de formalisme complet permettant une telle comparaison, 
bien que d’intéressantes tentatives [H.P. Robertson (1949), (1968); R. Mansouri, 
R.U. Sex! (1977)] aient eu lieu. 

Considérons, pour prendre un exemple simple, le postulat de la constance de 
la vitesse de la lumière [K. Brecher (1977)]. Afin de “modéliser” une éventuelle 
déviation, écrivons que la vitesse de la lumière c’, mesurée par un observateur 
inertiel, est donnée par 


=c+kv, (2.48) 


où v est la vitesse de la source et c la vitesse de la lumière dans le système de 
référence de la source : k est une constante qui dépend de la théorie considérée 
(k = 0 dans le cas de la Relativité Restreinte; k = 1 dans le cas de la relativité 
newtonienne; k prend d’autres valeurs pour d’autres théories encore). L'hypothèse 
k # 0 conduit [W. De Sitter (1913)] à toutes sortes d’effets sur les systèmes 
binaires d’étoiles : excentricité apparente de l’orbite; possibilité d’images multiples, 
d’inversion de l’ordre temporel d’événements, etc. Ces effets ne sont généralement 
pas observés [K. Brecher (1977); J.G. Fox (1962), (1965)] car la lumière émise se 
propage dans un milieu dispersif (le milieu interstellaire) et il existe une distance 
d’extinction caractéristique 


2 À mc? 
~ 2r(n-1) Ae? N 


dext. 
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(A : longueur d’onde : n : indice du milieu; N : densité électronique du plasma 
interstellaire), de l’ordre de 2 années—lumiére. Toutefois, pour de très courtes 
longueurs d’onde (pour des rayons X de 70 keV), la distance d’extinction est 
de l’ordre de 20 kpc. Aussi les caractéristiques des sources X binaires (Her. X1, 
Cen. X3, SMC. X1) ont-elles permis 4 K. Brecher (1977) de fixer une limite sur 
k: 


k<2x107°. 


Ainsi une théorie qui prédirait k = 1071 serait tout à fait acceptable. 

Venons-en maintenant à l’intéressant point de vue développé par H.P. Robertson 
[(1949) (1968)]. Cet auteur pose a priori quatre postulats auxquels doivent obéir 
les changements de référentiels d’inertie et en déduit une forme générale pour ces 
“transformations de Lorentz” généralisées, dépendant de paramètres arbitraires. 
Ces postulats sont les suivants : 

1 — Il existe un système de référence dans lequel l’espace est isotrope. 


2 — Dans ce système de référence, la vitesse de la lumière est c, indépendamment 
de la direction, du mouvement de la source, de la longueur d’onde, etc. 


3 — Il existe un autre système de référence qui se meut à la vitesse v (le long de 
l'axe des z, par exemple) par rapport au premier. 


4 La transformation qui permet le passage de l’un à l’autre système de référence 
est linéaire. 

Dans ces conditions, il n’est pas très difficile de montrer que la transformation 
de coordonnées qui fait passer des coordonnées du premier système {t, £, y, z} à 
celles du second {t’, x’, y’, 2’} est de la forme 


a(v}t + ex + ey + e'z 

a = b(v)[x — vt] 

= d(v)y 

2! = d(v)z 

où les fonctions a(v), b(v), c(v) et d(v) dépendent de la “théorie de la relativité” 
adoptée tandis que € et £’ sont déterminés par le procédé utilisé pour la synchronisa- 
tion des horloges [H.P. Robertson (1949) (1968); R. Mansouri, R.U. Sexl (1977)]. 
Avec les transformations précédentes et en utilisant la synchronisation des horloges 
d’Einstein, la vitesse de la lumière est alors donnée par 


(2.49) 


Eee (o+8- >) (2) simot a-p ier (2.50) 


où 6 est l'angle formé par l’axe des x” avec la direction de propagation d’un rayon 
lumineux (dans le second référentiel) et où les paramètres a, 5,6 représentent 
les premières déviations à la Relativité Restreinte d’Einstein, au travers des 
développements des fonctions a(v), b(v), c(v) et d(v) en puissance de (v/c)? : 
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= 1 + a(v/c)? +... 
bv) = 1 + B{u/c)? +.... (2.51) 
= 1 + é(v/c}? +... 


La théorie d’Einstein correspond alors à & = —1/2, 8 = +1/2,6 = 0. 

Les diverses expériences réalisées vont alors tester des combinaisons de ces 
divers paramètres; on aura ainsi [A. Brillet, J.L. Hall (1982)] les résultats qu’indique 
le tableau 2.2. 


2 
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LA 
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mm 
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Combinaison Valeur expérimentale Auteurs 


a —1/2+1077 G.R. Isaak (1970) 

D.C. Champeney et al. (1963) 
B+6 1/2+5x1077 A. Brillet et al. (1979) 
a—B 1.02+2x 107? R.J. Kennedy et al. (1932) 


Tableau 2.2 : Résultats expérimentaux pour les paramètres a,6,6 {d'après A. Brillet et al. (1982) ]. 


Cependant, quelque utile qu’il puisse étre, ce cadre théorique pour analyser les 
résultats expérimentaux visant à tester la Relativité Restreinte ne saurait être ni 
complet ni unique : d’une part, il est de nature purement cinématique et, d’autre 
part, il s’inscrit dans un cadre théorique déterminé — les quatre postulats posés par 
H.P. Robertson — qui, pour naturel qu’il soit, est assez arbitraire. 

Indiquons, pour clore cette section, que l’expérience de Hughes et Drever, 
mentionnée au chapitre 1, peut aussi être considérée comme un test de haute 
précision del’ invariance de Lorentz (locale) [voir C.M. Will (198 1)]. C’est pourquoi 
cette expérience a été améliorée à plusieurs reprises [voir, par exemple, T.E. Chupp 
et al. (1989); S.K. Lamoreaux et al. (1986); J.D. Prestage et al. (1985)]. 


EXERCICES 


1. On considère une étoile à symétrie sphérique, en équilibre hydrostatique. Soit p(r) sa densité 
de masse à la distance r et soit m(r) la masse contenue dans la sphère de rayon r. Soit enfin P(r) la 
pression à la distance r et P=P*(p) l'équation d’état à laquelle obéit la matière présente dans l’étoile. 


(i) En écrivant qu’un élément de volume de l'étoile est en équilibre hydrostatique (attraction 
gravitationnelle qui s’exerce sur lui est exactement compensée par la force due à la pression), trouver 
une équation satisfaite par dP/dr. 


(ii) Dans le cas relativiste et dans un système d’unités tel que G = c = 1, l’équation analogue à 
l’équation obtenue en (i) s’écrit 


dP(r) (e+ P).(m+4ar?P) 
dr r(r—2m) | 


(a) Rétablir dans cette équation les facteurs G et c. 
(b) Vérifier que lorsque c—+oo, on retrouve bien }’équation obtenue en (i). 
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2. A partir de la relation L7 G=GL~', montrer que les transformations de Lorentz orthochrones 
peuvent effectivement s’écrire sous la forme 


ch@ sh 
sh@ ché@ 


L(6) = 


En déduire que L(@1)L(62) = L(61+62), et vérifier la loi d’addition des vitesses. 
3. Soit 
0 0 
z cos@ sin 
II = , 
—sin@ cos@ 
0 0 


ooo re 
rF © © © 


Montrer qu’il s’agit d’une transformation de Lorentz. Laquelle? 


4. Dans ce problème, l’espace-temps de Minkowski possède deux dimensions seulement, Pune 
temporelle et l’autre spatiale. Les observateurs considérés ci-dessous sont équivalents en ce sens qu’ils 
possèdent des horloges identiques, qu’ils sont capables d’envoyer des signaux radar espacés par les 
mêmes intervalles de temps, et qu’enfin ils sont capables d’en recevoir l’écho avec des récepteurs 
identiques. On choisira un système d’unités dans lequel la vitesse de la lumière c est égale à un. 


Première partie : Effet Doppler longitudinal. Soient G et G’ deux observateurs inertiels animés l’un 
par rapport à l’autre d’une vitesse v : les droites d’espace-temps G et G” se coupent en O; on suppose, 
en outre, que G et G’ ont synchronisé leurs horloges en O{t=t'=0} et I’ est le cône de lumière de 
sommet O [Fig. 2.19]. Soit To la période des signaux radars envoyés par G sur G” et T la période de 
ces mêmes signaux tels qu’ils sont reçus par G’. 


G) A-t-on To=T? (justifier la réponse par un argument “newtonien”). Tracer un diagramme 
d’espace-temps correspondant à l’envoi par G, et à la réception, par G’, de signaux périodiques. 


Gi) On pose k(v)=T/To et l’on souhaite déterminer k(v) en utilisant le principe de relativité. 
Si l’on appelle T’ la période des signaux radar émis par G” et reçus par G, on posera k’(v)=T/To. 
Evaluer k’(v) en fonction de k(v) {faire un diagramme d’espace-temps : en quoi diffèret-il de celui 
de la question (i)?}. 


(iii) On se propose maintenant de calculer explicitement k(v), i.e. de démontrer la relation 


k(v) = [12] we. 


Au temps To (de son temps) G envoie sur G’ une impulsion radar que G” reçoit au temps T et qu’il 
réfléchit instantanément vers G. On appellera N et N” les points de la droite G où il y a respectivement 
émission puis réception du signal radar. On appellera N’ le point de la droite G’ où le signal émis par 
G est réfléchi. On appellera S le milieu de NN”. 


(a) Tracer un diagramme d’espace-temps correspondant à l’expérience précédente. 
(b) Pourquoi a-t-on ON’’={k(v)}?To? 
(c) Utiliser le diagramme de la question (a) pour démontrer la relation qui donne k(v). 


Deuxième partie : Quelques applications. (i) Soit t la coordonnée temporelle de N’ pour 
l'observateur G et soit t’ la coordonnée temporelle de N’ pour l'observateur G’. Montrer que 


t=t {iv} 1/2 (ralentissement des horloges en mouvement). 


(ii) On considère maintenant un troisième observateur inertiel G”, analogue aux précédents; G” 
possède une vitesse w par rapport à G et une vitesse u par rapport à G’. A l’aide d’un diagramme 
d’espace-temps similaire aux précédents, montrer que 


k(w) = k(v).k(u), 
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et en déduire que 


w = pts (addition des vitesses). 


Troisième partie : La transformation de Lorentz. La distance d’un point P de l’espace de Minkowski 
à un observateur inertiel est définie comme étant c fois la moitié de l'intervalle de temps qui sépare 
l’émission d’un signal radar de la réception de l’écho sur P (faire un diagramme d’espace-temps). 


Soit P un point d’espace-temps. G et G’ attribuent à P les coordonnées spatio-temporelles (t,£) 
et (t’,x’), respectivement. Démontrer que (t,x) et (t’,x’) sont reliées par les transformations de 
Lorentz habituelles. On s’aidera de la figure 2.19, du principe de relativité et des notations suivantes : 
OM=T,, OQ=T3, OR=T2. [cf. H. Bondi (1965); D. Bohm (1965)}. 


5. Montrer que le groupe de Lorentz se réduit au groupe de Galilée lorsque c—oo. 


6. Soit x un 4-vecteur du genre temps et soit y un 4-vecteur orthogonal à x (au sens de la pseudo- 
métrique de l’espace de Minkowski). Montrer que y est du genre espace. 


7. Montrer qu’un 3-plan k.x = const. est du genre espace dès que le 4-vecteur k est du genre temps. 
8. On considère, dans l’espace de Minkowski M , la 3-surface © définie par : 


1 =ashy cosy sin 


2 —ashx sing sinb 


3 —ashx cos@ 


x 
x 
T 
z? =achx 
où a est une constante positive 

G) Montrer que © est du genre espace. 

(ii) Calculer la métrique (i.e. l’élément de longueur) sur cette surface. 


(iii) Que se passe-t-il lorsque la constante a est négative ? 
9. Vérifier que la relation de causalité < est une relation d’ordre. 
10. Vérifier que la simultanéité est une relation d’équivalence. 


11. Soit P un 3-plan du genre espace et r+ la nappe du futur du cône de lumière. Trouver 
l'intersection de P et T+ (on s’aidera du principe de relativité). 


12. Soit 5 la 3-surface définie par la relation 
(2°)? #20? 
et soit P un 3-plan du genre espace, d’équation 
k?z? KE. E=b. 


Quelle est l’intersection de £ et de P? 


CHAPITRE 3 


La forme relativiste 
des lois de la physique 


On ne peut, par une expérience physique purement interne — de quelque nature 
qu’elle soit — mettre en évidence le mouvement (relatif) d’un système de référence 
galiléen; c’est le principe de relativité. Il s’ensuit que les lois de la physique 
— toutes les lois — doivent nécessairement avoir la même forme dans tous les 
systèmes d'inertie [Chap. 2]. Pour exprimer simplement cette propriété de manière 
analytique, pour éviter d’avoir à démontrer dans chaque cas que le principe de 
relativité est bien vérifié, il est extrêmement utile d’écrire les équations de la 
physique sous une forme manifestement covariante dans les transformations de 
Lorentz. Ainsi, non seulement on évite les vérifications du principe de relativité, 
souvent assez délicates (et toutes les erreurs que cela peut comporter), maïs encore 
cela permet de transcrire dans un contexte unique la physique dans l’espace- 
temps, donc muni de sa structure pseudo-métrique. Bien plus, l’exigence de la 
covariance manifeste de la formulation analytique d’un phénomène physique, 
formulation a priori inconnue, en imposera éventuellement les formes possibles. A 
cette fin, on utilisera des représentations diverses du groupe de Lorentz, spinorielles, 
tensorielles, etc. 


Le formalisme tensoriel 


1. Sauf mention explicite du contraire, nous n’utiliserons dans la suite que 
des coordonnées cartésiennes orthogonales au sens de la métrique de M . Elles 
comporteront donc un axe du genre temps Ox? et trois axes du genre espace 
Ox’ (i = 1,2,3) deux à deux orthogonaux, au sens de la métrique usuelle de 
R3; ces trois axes spatiaux seront orthogonaux à l’axe Ox°, l’axe temporel, au 
sens de la métrique de l’espace de Minkowski [Fig. 3.1]. 

Autrement dit, si {e,, } (u = 0, 1, 2, 3) désigne une tétrade (“vierbein”) de quatre 
vecteurs unitaires, colinéaires aux quatre axes Ox” et d’origine O, on aura, aussi 
bien par construction que par définition, 
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e; espace xi 


Figure 3.1 : Système de coordonnées lorentziennes et repère associé. 


< €p, €v > = Nw (3.1) 


où <, > désigne le (pseudo-) produit scalaire de l’espace de Minkowski, déterminé 
par 7 = |In]: 
Remarques sur les notations 


(i) Dans les paragraphes précédents, nous avons désigné le produit scalaire par un point; ainsi, avec 
la notation précédente, nous aurions 


Lepu, Ev > = €y-€v. (3.2) 
(ii) De même, nous avions désigné par G la matrice du tenseur métrique; c’est-à-dire 
G = linuri. (3-3) 
Dorénavant, nous la dénoterons aussi par 7, réservant 
G = [Iguvil 
au cas de la Relativité Générale ou au cas de ja Relativité Restreinte écrite en coordonnées 


curvilignes : 7, sera indépendant de l'événement d’espace-temps considéré, alors que gy en 
dépendra. 


(iii) Nous utiliserons également la convention suivante, d’un usage courant dans la littérature : les 
indices grecs varieront de 0 à 3; les indices latins varieront de 1 à 3. 


(iv) En outre, nous utiliserons la convention d’Einstein de sommation des indices répétés, dans une 
même formule. Par exemple, le symbole X“*°.A,,; signifie 


KH”? Api = KH”? Api. (3.4) 

Si A désigne maintenant un vecteur quelconque de M (c’est-à-dire la donnée 
de O, l’origine, et d’un point M de l’espace de Minkowski), on écrira 

A = e, A". (3.5) 


Les A“ seront les composantes contravariantes de A. Dans l’équation (3.5), on 
a évidemment utilisé la convention d’Einstein et l’on a donc, explicitement, 


e, AY = eoA° + ej A! + e24? + eA’. (3.6) 
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Les composantes covariantes de A, c’est-à-dire A,,, sont définies par 


Ay =< A, e, > (3.7) 
= À,<e,, ei > (3.8) 
ou encore 
Ay = Nh A7. (3.9) 
Explicitement, on a donc 
A? = Ag et A’ = —A,. (3.10) 


Le signe moins est dû au fait que le tenseur métrique nuy n’est pas défini positif, contrairement au 
cas euclidien (dans ce dernier cas, en utilisant des coordonnées cartésiennes, on a alors un signe 


plus). 


Posons maintenant 


n= nl (3.11) 
de sorte que, numériquement 
1 0 0 
Bates Fk: 8 28 3.12 
(Ime = l=] yg (3.12) 
0 0 0 —1 


Mathématiquement, 7“” est le tenseur (pseudo—) métrique de l’espace dual (i.e. l’espace des formes 
linéaires sur l’espace des vecteurs A de M ); c’est pourquoi les deux indices u et v sont “relevés”. 


On peut alors inverser la relation (3.9); ce qui donne 
AY = n” A, (3.13) 


Soient maintenant deux vecteurs A et B attachés à la même origine O; leur 
produit (pseudo) scalaire s’écrira alors 


< A,B > = < Ae, B’e, > (3.14) 
= AB’ <e,,e, > (3.15) 
= Nv AY BY (3.16) 
= A, BY (3.17) 
= A B, (3.18) 
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où l’on a utilisé, outre la bilinéarité du produit scalaire [passage de (3.14) à 
(3.15)], la définition (3.1) du tenseur métrique [passage de (3.15) à (3.16)] et 
la règle d’abaissement de l'indice (3.13) [passage de (3.16) à (3.17) ou (3.18)]. 
Explicitement, on a encore 


i=3 
AB, = AB? — NT ALB 
i=l 


Notons enfin que si dM désigne un intervalle infinitésimal entre deux événe- 
ments de M, on aura 


ds? =< dM, dM > = Nu dx“ dx” ; (3.19) 


C’est la métrique de l’espace-temps exprimée à l’aide des conventions d’indices 
et de sommation que nous venons d’étudier. 

Avec cette notion de produit scalaire, on se rend facilement compte de ce que le 
signe de la (pseudo-) norme d’un vecteur A détermine son genre : 


A, A" > 0 — A est du genre temps 
A,AF <0 — A est du genre espace 
A, A¥ =0 — A est isotrope. 


(Fig. 3.2]. On constate que le genre d’un vecteur A, c’est-à-dire le signe de 
sa (pseudo-) norme, est invariant dans une transformation de Lorentz : cette 
transformation laisse, par construction, le produit scalaire de M invariant. 


A2>0 


(genre temps) 


r 


A2 = 0 (isotrope) 


A2 <0 
(genre espace) 


(0) 


Figure 3.2 : Différents genres de 4—vecteurs. Le genre des différents quadrivecteurs (espace, temps, 
isotrope) dépend de leur situation relativement au cône de lumière. 


2. Etudions maintenant de manière un peu plus précise l’action des transforma- 
tions de Lorentz sur les composantes des quadrivecteurs de M. Bien entendu, un 
vecteur est un être géométrique intrinsèque qui est donc défini indépendamment 
de tout système de coordonnées, lorentzien ou non. Toutefois, ses composantes 
varient lorsque changent les coordonnées utilisées. Nous nous limiterons ici aux 
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changements de coordonnées lorentziennes [Fig. 2.14], les changements généraux 
étant étudiés plus loin. 

Soit L une transformation de Lorentz, qui vérifie donc la relation (2.22), c’est- 
à-dire 


LTL = p. (3.20) 
Elle fait passer de la tétrade {e,,} à la tétrade {e’,, } par la relation ! 


e, = Ly” ev (3.21) 


ce qui conduit immédiatement à 


>= Li < ea, €p > 
= Teg LL, PA (3.22) 


mais comme la métrique est invariante dans les transformations de Lorentz [c’est 
ce qu’exprime la relation (3.20)], 


< €p € > =< ey, Oy > = Mur (3.23) 
on a donc 
Mur = Nas | reas Ly”: (3.24) 
Cette dernière égalité montre que, si l’on inverse la relation (3.21) comme 
aE) Mea, (3.25) 
alors on a nécessairement 
(277), = man’? Le. (3.26) 


Notons enfin que, dans les transformations de Lorentz, les coordonnées x” (ou, 
plus précisément, les composantes x“ du vecteur OM) se transforment, de sorte 
que 


OM = e’, 2" = e, x" (3.27) 
ou encore 
Lp” epr" = epr"; (3.28) 


1. Plus haut, nous avons appelé L la transformation x’ =LX. En réalité, si L fait passer de e à e’, alors 
z'=L tx. C’est cette dernière définition que nous utiliserons désormais. 
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c’est-à-dire 


Lu ct = g. (3.29) 


En inversant cette dernière relation, on obtient 


GE ee à Por eur à (3.30) 


ou 
a'h= LH x. (3.31) 
def 


Cette définition de L” , et la relation (3.24) donnent alors 


LE v = fva n”? Lg a (3.32) 


(attention à la position des indices : voir plus loin). 

3. De manière générale, on appellera quadrivecteur un être mathématique a 
quatre composantes qui, dans une trasnformation de Lorentz, se transformeront 
soit comme les coordonnées (composantes contravariantes) soit comme les e, 
(composantes covariantes). Autrement dit, À sera un quadrivecteur si et seulement 
Si, 


AU = LH, AY 
(3.33) 
ACL NE PA 


dans un changement de base {e,,} — {e’ ,.}. 


Il est bon de préciser, à ce stade, que la “définition” précédente d’un quadrivecteur n’en est pas une! 
Elle représente seulement un critère pratique pour reconnaître si quatre quantités physiques (comme, 
par exemple, la densité de charge et le courant électrique) forment bien un être mathématique auquel 
correspond une même réalité physique : deux observateurs galiléens mesurant le même phénomène 
physique — l’un obtenant les nombres (A°,A?,A?,A*) et l’autre les nombres (A’°, A’, A’, A‘) — 
doivent nécessairement pouvoir confronter leurs résultats à l’aide des relations (3.33). Ajoutons 
encore que cette “définition” permet l’usage pratique de fenseurs (voir plus loin) sans qu’il 
soit réellement besoin d’une définition rigoureuse mais, de fait, inutilement compliquée. Plus 
explicitement, cela signifie qu’on ne s’intéresse qu’au sous-espace vectoriel de R* stable dans 
les transformations de Lorentz, seul sous-espace auquel on attribue un sens physique. 


Ainsi, une loi physique s’exprimant analytiquement sous la forme 


At = BH 


sera manifestement covariante dans le groupe de Lorentz; autrement dit, elle aura 
la méme forme dans tous les repéres galiléens, puisque, dans tout autre repére, elle 
s’écrira encore 


Alt = BH. 


Notons encore que les quadrivecteurs — sous réserve de leur signification 
physique — forment un espace vectoriel et que l’on peut donc les ajouter ou 
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les multiplier par des scalaires : ce sont aussi des vecteurs de R*! Finalement, 
mentionnons que les quadrivecteurs d’un méme genre ne forment pas des sous— 
espaces vectoriels de R4 [Fig. 3.3]. 


temps 


es 
espace 


(œ) (d) 
Figure 3.3 : L’addition de différents types de 4-vecteurs (temps, espace, isotrope) ne conserve pas 


nécessairement leur genre commun éventuel. Réciproquement, un quadrivecteur peut être obtenu comme 
somme de quadrivecteurs de genre quelconque. 


4. A côté des quadrivecteurs existent des invariants, dont nous avons rencontré 
plusieurs exemples, tels 


ds? =. Np dz” dr” = dz, dr” 


A? = A,A#, <A,B>= A,B". 


On trouve également des opérateurs scalaires, tel le dalembertien 


D= 3 z x (3.34) 
qui peut encore s’écrire 
= Mur OF 0” = 0,0" = 0,” etc. (3.35) 
où l’on a posé 
On = ae (3.36) 
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Que la dérivée par rapport aux coordonnées (contravariantes) constitue un opérateur quadrivectoriel 
covariant résulte du fait que, si f(x) représente une fonction invariante arbitraire des x“, sa 
différentielle df étant elle-même invariante, on aura 


df (x) = 0, f(x) dr". (3.37) 


Cette dernière relation ne pourra être invariante que si 0, f est un covecteur (un quadrivecteur 
covariant). 


5. Outre les invariants et les quadrivecteurs, on trouve encore des êtres mathéma- 
tiques comportant plusieurs indices, que l’on peut additionner et multiplier par des 
scalaires (sous réserve qu’ils comportent le même nombre d’indices, disposés de 
manière analogue) et que l’on appellera des tenseurs, dès lors que dans une trans- 
formation de Lorentz ils se transforment comme 


NP ee LR OL CD ET) ss 
(3.38) 
Autrement dit, chaque indice tensoriel “possède” les propriétés de transforma- 
tion d’un quadrivecteur : les composantes d’un tenseur se transforment comme un 
produit de composantes (soit contravariantes, soit covariantes) de quadrivecteurs 
[Appendice A]. 
A partir de tenseurs de même nature, comme par exemple UF” agy et V” apy, 
on peut former d’autres tenseurs, tels 


a UF” apy + DVM apy 
Ur apy: yr Tpé- 


Un tenseur de rang n (à n indices tensoriels) peut être contracté sur deux de ses 
indices (l’un covariant, l’autre contravariant) pour donner un tenseur de rang n — 2; 
par exemple 


U apy > UM ye, > U™ upy 
(rang 5) (rang 3) (rang 1) 


ou bien 


U" apy — U” avy ete. 
Par dérivation, on obtient un tenseur de rang n + 1 : 


U apy > OU apy 


(rang 5) (rang 6) 
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Ajoutons encore que les transpositions d’indice fournissent encore d’autres 
tenseurs, de méme rang; par exemple 


U™ apy > UF ypa - 


Parmi les propriétés qui se conservent dans les transformations de Lorentz citons, 
outre le rang d’un tenseur, ses éventuelles propriétés de symétrie ou d’antisymétrie 
dans les permutations d’indices de même nature (c’est-à-dire soit contravariants, 
soit covariants). 

6. Un tenseur particulièrement utile est le tenseur de Levi-Civita, défini par 


+1 si afyé est une permutation paire de 0123 
eP — À _1 si ayé est une permutation impaire de 0123 
0 autrement. 


Il est aisé de se rendre compte que le tenseur £ est réellement un tenseur si l’on se 
limite aux transformations de Lorentz propres; sinon, le tenseur transformé change 
de signe. Etant donné un tenseur de composantes T#,, son déterminant sera donné 
par 


1 
dét.T — gE” ee. Tys Tix Tuv Too: 


A l’aide du tenseur métrique 7, on peut également former les (pseudo-) tenseurs 
Eves, Crap, etc. Le terme “pseudo—” se rapporte au changement de signe des 
composantes de € dans les transformations de Lorentz impropres. 

7. La covariance manifeste des équations de la physique, c’est-à-dire l’inva- 
riance de forme dans les transformations de Lorentz, se traduira par des équations de 
nature tensorielle (ou spinorielle, dont nous n’ avons pas parlé ici) dont de nombreux 
exemples seront rencontrés par la suite. 


L'effet Doppler et le phénomène d’ aberration 


Une illustration de l’application de la covariance manifeste des lois de la 
physique est fournie par l’étude de l’effet Doppler relativiste et du phénomène 
(qui lui est lié) d’aberration : la fréquence d’une onde électromagnétique, selon 
qu’elle est observée dans le système de référence au repos de l’émetteur ou dans 
un référentiel galiléen animé d’une vitesse donnée, apparaît différente; en outre, la 
direction de propagation de la même onde est également différente pour les deux 
observateurs. Nous poserons Vobs et Vem les fréquences respectivement observées 
dans un référentiel galiléen {O.s, x, y, z} et émise par une source située dans 
un autre référentiel galiléen {Ogm, x’, y’, z’} animé par rapport au premier d’une 
vitesse v parallèle à Oz. De même, nous appellerons Oop, l’angle formé par l’axe 
Ost et le rayon lumineux observé, d’une part, et Oem celui formé par le rayon 
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émis et l’axe Oémx” d’ autre part. Le problème est alors de relier Vobs à Vem, d’une 
part, et Oops à Oem, d'autre part. 

Remarquons d’abord qu’une onde électromagnétique en propagation dans le 
vide satisfait l’équation des ondes, Oy = 0, où y est soit le champ électrique, soit 
le champ magnétique de l’onde. Cette équation admet des solutions du type “onde 
plane” 


y(t) = Afk)? , 


où k est nécessairement un quadrivecteur (par ailleurs arbitraire) en raison de 
Pinvariance relativiste de l’équation des ondes : cette dernière propriété peut 
également étre obtenue en remarquant que ce quadrivecteur d’onde est, dans 
l’espace de Minkowski, dirigé selon une génératrice du cône de lumière de sommet 
Oém; autrement dit, selon un rayon lumineux issu de Ogm. Il en résulte que le 
4-vecteur k est isotrope, k? = 0, propriété obligatoirement satisfaite si y doit être 
solution de l’équation des ondes. 

Cela étant, écrivons que la phase k.x de Ponde 4 est un invariant de Lorentz, 
ie., 


kuz” = kya’? ; 
ou encore 
koz? — k.x = kor” — k’.x’, (3.39) 
soit, finalement 
kolt - n.x] = kg [t -n'.x'] (3.40) 
avec n = k/ko, et où l’on a utilisé le caractère isotrope du 4-vecteur k, c’est-à- 
dire la relation k°? = k?. Le vecteur k (resp. k’) peut être choisi dans le plan 
LOovsy (resp. dans le plan x’Ogmy’), de sorte que ps et 06m sont alors donnés 
par ? [Fig. 3.4]. 
kx = kz cos Îobs + ky sin Oops 
k’.x’ = k'x/ cos Om + k’y’ sin bem- 


Dans ces conditions, la relation (3.40) se réécrit 


2. Dans la suite de ce paragraphe x et k ne désigneront plus des 4-vecteurs mais les normes de 
3-vecteurs. 
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ko[t —n.x] = k [t — n’-x’] 
= thy [roy + | 


cos ém | 


— cko | tse + SE 


— yko sin ém 


= kot — kz cos Oops — Y ko sin fobs- 
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Identifiant maintenant les coefficients de t, x et y dans cette dernière expression, 


il vient 
ko Sin Obs = kọ sin 06m 


ko = Ey [1 +v cos 06m] 


— pl v+cos 06 
ko cos Bobs = ko ANT 7 


Figure 3.4 : L’effet Doppler relativiste et le phénomène d’aberration (diagramme d’espace-temps). 
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Ces équations conduisent immédiatement aux relations recherchées 


sin 0ém.V1 — v? 


ta0b = Al 
9% obs u+ cos Bem (3 a) 
V2 
Vobs = Fa [1 +v cos ĝem] ; (3.41b) 


les relations analogues fournissant les grandeurs liées à la source en termes des 
grandeurs observées s’obtiennent sans difficulté en effectuant les substitutions : 
obs «— ém, v ++ —v. 

A la limite non relativiste, i.e. lorsque v < 1, l’expression (3.41b) se réduit à la 
suivante : 


Vobs © Vém [1 +v cos Om] , 


qui n’est autre que |’ expression usuelle de |’ effet Doppler non relativiste.La relation 
(3.41a) représente un effet d’aberration tandis que la (3.41b), qui traduit l'effet 
Doppler relativiste proprement dit, présente quelques cas particuliers importants. 
Lorsque fobs = 0 ou Oobs = 7, l'effet Doppler est purement longitudinal, la source 
se meut vers l’observateur ou, au contraire, s’en éloigne. Dans le premier cas, on a 


l+v 1/2 
Vobs = Vem iy > Vém ; 


c’est-à-dire un bleuissement apparent de la source. Dans le second cas, où la source 
s’éloigne de l’observateur, on obtient 


1" 1/2 
Vobs = Vem < Vém » 


c’est-à-dire un rougissement $ apparent de la source. Cependant, lorsque Obs = 
a /2,c’ est-à-dire lorsque la ligne de visée est perpendiculaire au mouvement relatif, 
il vient 


Vobs = ee ) 
Vl-v? 
un effet qui est spécifiquement relativiste — qui n’a pas d’ analogue non relativiste — 
l'effet Doppler transverse. 


La description cinématique du mouvement d’une particule 


Dans l’espace-temps, le mouvement d’une particule soumise a une force 
quelconque est décrit complètement par la donnée d’une courbe, par la donnée 


3. En franglais “redshift”. 
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Figure 3.5 : Courbe du genre temps. Une courbe du genre temps est contenue dans tout cône de 
lumiére dont le sommet est situé sur elle. 


de sa trajectoire spatio-temporelle, c’est-à-dire par sa ligne d’univers : il en est 
exactement de même dans l’espace de Minkowski aussi bien que dans l’espace- 
temps newtonien. 

Une telle trajectoire d’espace-temps {Fig. 3.5] peut être décrite paramétrique- 
ment 


z” = (6), 


où € est un paramètre arbitraire. Bien entendu, on peut toujours choisir £ = 2° /c = 
t; auquel cas, on retrouve bien la forme usuelle 


(x =x, 


Cependant, contrairement au cas newtonien où toutes les trajectoires d’ espace— 
temps sont admissibles — sous réserve, toutefois, qu’elles ne remontent pas le cours 
du temps [Fig. 3.6] —, les trajectoires relativistes sont astreintes à être du genre temps 
(Fig. 3.7]. Cela signifie que, pour chaque point M de la trajectoire d’espace-temps, 
la trajectoire future se trouve entièrement située à l’intérieur de la nappe future du 
cône l'(M). 

La raison de cette restriction, qui est l'expression de la causalité, est la suivante. 
Si l’on considère un point M” très voisin de M [Fig. 3.7], la vitesse moyenne avec 
laquelle la particule est passée de M à M’ est Ax/At et doit être inférieure à celle 
de la lumière. Il s’ensuit que le quadrivecteur MM’ est toujours situé à l’intérieur 
de l'(M) et est donc du genre temps. 

Cette propriété des trajectoires possibles d’être du genre temps va se traduire sur 
les quadrivecteurs tangents à la trajectoire : ils devront tous être du genre temps. 
Un tel quadrivecteur, soit 


86 La forme relativiste des lois de la physique 


trajectoires 
permise interdite 


cône de 
lumière 


Figure 3.6 : Causalité des trajectoires. Elle se traduit par le fait qu'elles sont nécessairement du genre 
temps. 


Figure 3.7 : Trajectoire du genre temps. La vitesse moyenne pour aller d'un point quelconque de la 
trajectoire à un autre, arbitraire, doit nécessairement être inférieure à la vitesse de la lumière. Il s'ensuit 
que la quadrivitesse (cas limite où les deux points sont confondus) est du genre temps. 


dg” 
He = ee, 
WO) = 
devra donc satisfaire à la condition 
dz, drt ds? 


u” (E}u,(£) = T dE ae 


Etant tangent à la trajectoire, le quadrivecteur u” (£) sera, par définition, une 
quadrivitesse. De manière analogue, on définira une quadri—accélération par 
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du” (£) drt (£) 
=i gee (3.42) 


y” (E) 

A priori le paramètre £ ne possède pas de signification physique directe quoique, 

à la rigueur, on puisse le considérer comme une échelle de temps quelconque. En 

fait, parmi tous les paramétrages possibles d’une trajectoire d’espace-temps, il en 

est un qui admet une signification physique immédiate. Il s’agit du paramétrage 

défini par l’arc de (pseudo-) longueur de la trajectoire, dont l’élément infinitésimal 

est ds. Plus précisément, on utilisera le paramétrage défini par ds? /c?, qui possède 
alors les dimensions d’un temps et l’on posera 


dr? = ds?/c?. (3.43) 


Le paramètre 7 s’appelle le temps propre. C’est un invariant qui possède donc la 
même valeur numérique dans tous les repères d’inertie, et qui représente le temps 
d’un observateur en co-mouvement avec la particule. Dans la suite, nous utiliserons 
le plus généralement un système d'unités dans lequel la vitesse de la lumière est 
prise pour unité de vitesse; il s’ensuivra qu'il n’y aura plus lieu de distinguer entre 
les paramètres 7 et s, entre x? et t, etc. 

Avec le paramétrage défini par le temps propre, la quadrivitesse est un quadri- 
vecteur unitaire 


— dat 
= 
(3.44) 
uu, = 1. 
En dérivant par rapport à 7 la seconde de ces égalités, il vient 
du” 
Uni = upy” = 0; (3.45) 


autrement dit, la quadri—accélération est toujours orthogonale à la quadri-vitesse. 
En outre, puisque u” est un quadrivecteur du genre temps, y", qui lui est orthogonal, 
est un quadrivecteur du genre espace [Fig. 3.8]. 


Exemple 1 : Considérons le cas d’une particule libre; son mouvement est décrit par une droite du 
genre temps dans l’espace de Minkowski, d’équation 


a (r) =u”. (r-T) + 2b (3.46) 


dans un système de coordonnées lorentziennes arbitraires. Dans l’équation (3.46), zh est un 
quadrivecteur arbitraire et 7o un temps propre quelconque tel que 


a" (ro) = xo . 


88 La forme relativiste des lois de la physique 


espace 


Figure 3.8 : Genre des grandeurs cinématiques. La quadrivitesse est du genre temps (causalité), 
tandis que la quadri-accélération, qui lui est orthogonale, est du genre espace. 


Exemple 2 : Le mouvement décrit par les relations 


a°(£)=roshé, aæ!=rocht, a? =23 = 


© 


représente bien une trajectoire du genre temps car la 4—vitesse correspondante 
u (E) = roch, ul(é)=tosh€, uw? =u? =0 
est bien du genre temps : u“(€)u,,(€)=To ?>0. De même, la quadri-accélération est donnée par 


P(E) = To shẸ = 2°(€), y (E) = To ché = x? (£) 


~ =7=0. 


On vérifie facilement que ypu” =0. 


Revenons maintenant au temps propre. La relation (3.44) donne 


dt = u? dr. (3.47) 
Comme, d’autre part, [Eq. (3.43)] 
dr? dx? à 
on a encore 
1 
u? = ——— (3.49) 


On trouverait de méme 


u=- 5 (3.50) 


(dans un système d’unités où c Æ 1, il faut remplacer les facteurs v par v/c). 
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A la limite non relativiste, lorsque v < c, on obtient 


u? x1, uzo 
d à 


Si l’on choisissait une définition où u” est homogène à une vitesse, on aurait 4 


u xv. 
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Jusqu’ à présent, nous avons redéfini une nouvelle cinématique, en imposant que 
les changements de systèmes d’inertie conservent les lois de l’électromagnétisme 
[il nous restera à vérifier (Chap. 5) que les équations de Maxwell — lesquelles 
constituent la formulation analytique de ces lois — peuvent effectivement se 
mettre sous forme manifestement covariante et satisfont donc bien au principe de 
relativité]. Dans ces conditions, les lois de la dynamique newtonienne, covariantes 
dans le groupe de Galilée, ne le seront plus dans le groupe de Lorentz; elles ne 
satisferont donc pas le principe de relativité d’Einstein et nous devrons alors les 
modifier en conséquence. 

En physique newtonienne, la loi fondamentale de la dynamique constitue un 
postulat supplémentaire (la seconde loi de Newton; voir le chapitre 1) que l’on 
doit ajouter aux postulats de nature cinématique, comme le principe d’ inertie ou le 
principe de relativité. En relativité, il en est évidemment de même : l’ analogue de 
la seconde loi de Newton constitue un postulat que nous pourrions poser a priori. 

Pour trouver la forme relativiste de la loi fondamentale de la dynamique, nous 
devrons utiliser les grandeurs cinématiques disponibles pour décrire la trajectoire 
d’espace-temps, le principe de relativité en écrivant des relations manifestement 
covariantes, le fait qu’à faible vitesse on doive retrouver les résultats newtoniens 
usuels et, enfin, le critére de simplicité. 

La premiére question qui se pose est la suivante : comment généraliser la notion 
d’impulsion et celle d’ énergie? En physique non relativiste, ce sont des grandeurs 
qui se conservent dans les chocs de particules ou qui sont des intégrales premières 
du mouvement. On sait, en effet [H. Goldstein (1980), ou L. Landau et E. Lifschitz], 
que ces lois de conservation résultent de l’homogénéité de l’espace et de l uniformité 
du temps, propriétés également vraies dans l’espace de Minkowski. Cependant, ces 
lois de conservation ne peuvent pas être transposées telles quelles : aussi bien 
l'énergie cinétique d’une particule libre 1/2 mv? que son impulsion mv n’ont 
pas la même forme après transformation de Lorentz. Il faut donc commencer par 
modifier les relations qui lient impulsion et vitesse, énergie et vitesse. Or, le seul être 
mathématique qui ne fasse intervenir que la dérivé première par rapport au temps 


4, La composante 0 de u” possède une limite singulière et ne doit pas être considérée. 
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est la quadrivitesse u”. De même, la généralisation la plus simple du quadrivecteur 
newtonien (c’est-à-dire pour le groupe de Galilée) constitué par (E, p) est une 
quadri-impulsion que nous dénoterons p“. Aussi la seule possibilité de lien entre 
pl et u” est-elle un lien de proportionalité 


pl = mou“ (3.51) 


` 


qu’il reste à interpréter et à vérifier expérimentalement (ou, du moins, ses 
conséquences). 
Considérons d’abord les composantes spatiales p. On a 


mov 


= mu = ——= 3.52 

aa aa 
2 

= mov + LAAs + mov O(v?/c?) (3.53) 


où nous avons rétabli les facteurs c dans la dernière équation, sur laquelle on 
voit désormais que, pour v? < c?, on obtient bien la limite newtonienne usuelle 
P = MoV; Mo représente donc bien la masse. 

Examinons maintenant la composante temporelle p°; on a 


0 0 Mo 


=m = 3.54 
2 
= mo + ee + mo O(v*) (3.55) 


où, en rétablissant les facteurs c et en multipliant les deux membres de cette dernière 
équation par c?, il vient 


1 
pP? = moc? + 3 mv + moc? O(v4/c*). (3.56) 


A l’approximation non relativiste, lorsque v? < c?, cette dernière expression 
se réduit à 


1 
pe & moc? + z Mov" (3.57) 


qui montre que p° (en unités c = 1; ou p°c? en unités où c Æ 1) doit être interprété 
comme une énergie, et même comme l’énergie d’une particule libre. En outre, 
la relation (3.56) confirme clairement l’interprétation de la constante mp comme 
masse de la particule. Revenons au cas relativiste et à l’équation (3.54). Si nous 
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nous plaçons dans un système de référence au repos par rapport à la particule, donc 
siv = 0, p? se réduit à 


p = E = mec’. (3.58) 


Autrement dit, alors que dans le cas classique, le zéro de l’énergie d’une 
particule libre est arbitraire, la relativité en fixe la valeur. Cependant, la relation 
(3.58) représente beaucoup plus qu’une convention fixant le zéro de |’ énergie; elle 
montre que la masse d’un corps possède un véritable contenu énergétique. C’est 
cette équivalence entre masse et énergie qui va bouleverser fondamentalement 
les lois de la gravitation. La relation (3.58) [ou la (3.59), plus bas] est très 
bien vérifiée expérimentalement dans une multitude de phénomènes physiques : 
réactions nucléaires, collisions entre particules élémentaires, etc. 

Les relations (3.52) et (3.54) peuvent encore s’écrire sous la forme 


p =mv 
E = me 
où l’on a posé 


m 


qui représente la masse relativiste d’ une particule libre : alors que mo est la masse 
au repos — le contenu de matière de la particule — m est la masse en mouvement et 
l’on a toujours m > mo. 

A partir du quadrivecteur p”, on peut former l’invariant p,p” dont il est facile 
de se rendre compte qu’il vaut m2, 


Pa P“ = Mo”, (3.60) 


qui s’écrit explicitement ainsi : 


p” pu = -p = mc, (3.61) 


ce qui fournit la relation entre l’énergie et l’impulsion relativiste 


E = \/ m} + p? (3.62) 


très différente de la relation newtonienne E&E = p?/ 2mo, à laquelle elle se réduit 
lorsque c — œ et en éliminant l’énergie de masse. 


L’équation du mouvement d’une particule libre s’écrit donc 


mo du = Wi _ 9, (3.63) 


T 
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Si l’on a affaire à un problème de collision ponctuelle de deux particules de quadri-impulsions p% 


et p>, la quantité př +p% se conservera et l’on aura alors 5 


ph + ph = pit + pt (3.64) 
où les p” représentent les quadri-impulsions après collision. 


Venons—en maintenant à la dynamique relativiste proprement dite, c’est-à-dire 
à l'intervention de forces, d'interactions. Comme dans le cas newtonien, nous 
supposerons — c’est un fait empirique — que les positions et les vitesses initiales 
d’une particule suffisent à déterminer complètement son mouvement, c’est-à-dire 
sa trajectoire d’espace-temps. Dans ces conditions, la loi de la dynamique relativiste 
la plus simple mathématiquement sera constituée par une équation différentielle du 
second ordre. En outre, si nous exigeons — comme dans le cas newtonien — que la 
force soit génératrice du changement de l’impulsion, alors nous devrons poser 


= ft (z^ p`) (3.65) 


où f” (xò, pò) sera la quadri-force. C’est le seul type d’équation manifestement 
covariante que nous puissions avoir, compte tenu des hypothèses effectuées. I] 
reste encore à interpréter f”. Il est aisé de vérifier que les composantes spatiales 
de l'équation (3.65) fournissent bien la seconde loi de Newton, après passage à 
l’approximation non relativiste v? < cœ. La composante 0 se réduit, à cette même 
approximation, à 


dE 0 
— = , 3.66 
— =f (3.66) 
qui montre que f° doit être interprétée comme la puissance. 
Si l’on différencie les deux membres de l’équation (3.60), il vient alors 


dp” 
Pe y = 0, (3.67) 


de sorte que, multipliant la loi de la dynamique relativiste (3.65) par p”, on trouve 


Pa fË = 0. (3.68) 

Cette relation permet de relier f° aux autres composantes f* de la quadri-force 
f. 

p= => = fv. (3.69) 


En outre, elle montre qu’en relativité, les forces dépendent toujours des vitesses, 
contrairement au cas newtonien. 


5. Toute la cinématique des collisions entre particules élémentaires peut être trouvée dans les ouvrages 
complémentaires de R. Hagedorn (1964) et de E. Byckling et K. Kajantie (1973). 
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Un exemple de force relativiste est celui de la force de Lorentz à laquelle est soumise une particule 
chargée plongée dans un champ électromagnétique; elle est de la forme générale 


Happ’, (3.70) 


où y” „ est un tenseur antisymétrique lié au champ électromagnétique de manière directe [Chap. 5]. 
On vérifie alors facilement que la relation (3.68) est bien satisfaite. 


Ajoutons que la propriété précédente (orthogonalité de la quadri-force et de 
l’impulsion) ne serait plus vérifiée si l’on avait affaire à des particules de masse 
variable. 

Le cas de systèmes de particules relativistes en interaction est plus complexe 
car les actions doivent généralement se propager à des vitesses inférieures à celle 
de la lumière. Il en résulte alors des systèmes d’équations intégro-différentielles, 
non locales, ou encore des systèmes différentiels où l’interaction est véhiculée 
par des champs classiques, lesquels obéissent à d’autres équations [J. Rzewuski 
(1960); A.O. Barut (1965)]. En fait, la dynamique relativiste ne prend une forme 
réellement satisfaisante que dans le cadre de la théorie quantique des champs [voir, 
par exemple, C. Itzykson et J.P. Zuber (1980)]. 
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Pour décrire les différents objets géométriques (quadrivecteurs, tenseurs, spi- 
neurs, etc.) susceptibles de représenter des grandeurs physiques, nous avons jus- 
qu’à présent utilisé des coordonnées lorentziennes, donc rectilignes et orthogonales 
au sens de la (pseudo—) métrique de l’espace de Minkowski. Cependant, ces ob- 
jets géométriques sont des êtres mathématiques définis indépendamment de tout 
système de coordonnées, lorentziennes ou non. Certes, en Relativité Restreinte les 
coordonnées lorentziennes (qui correspondent physiquement au temps et à l’es- 
pace d’observateurs galiléens) s’imposent d’elles-mêmes et, en général, on n’a nul 
besoin d’utiliser des coordonnées curvilignes quelconques. Néanmoins, l’intro- 
duction de ce type de coordonnées présente l’avantage d’introduire des techniques 
extrêmement voisines de celles utilisées en Relativité Générale et donc d’en faciliter 
la compréhension. 

1. Soit M un point de l’espace de Minkowski et {2"} 9 1,93 des coordonnées 
curvilignes quelconques. {e,,} désigne un ensemble de quatre quadrivecteurs 
linéairement indépendants tangents aux lignes-coordonnées. La base formée par 
les e, n’est pas nécessairement orthogonale et les e, ne sont pas nécessairement 
unitaires. En outre, la base {e,, } est constituée par un quadrivecteur du genre temps 
et trois quadrivecteurs du genre espace; cela n’a rien d’obligatoire, mais si l’on veut 
pouvoir trouver un sens physique direct aux lignes—coordonnées, il est nécessaire 
qu'il en soit ainsi : la ligne-coordonnée du genre temps représente alors la trajectoire 
d’univers d’un observateur accéléré [Fig. 3.9]. 

Le problème que nous voulons résoudre est le suivant : étant donnés deux points 
d’espace-temps M et M’, auxquels sont attachés deux repères {e,,} et {e’,} et 
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Figure 3.9 : Coordonnées curvilignes et repère associé. 


des systèmes de coordonnées {x} et {x/#}, déterminer le passage d'un repère à 
l’autre pour les composantes des tenseurs attachés aux diverses grandeurs physiques 
considérées. Ce problème revêt des aspects qui, évidemment, sont liés. D’une part, 
il faut savoir changer de coordonnées en un point M donné et, d’autre part, savoir 
comparer (transporter) un tenseur (ou plutôt ses composantes) en M et en M’. 
Subsidiairement, comment écrire les lois de la physique de telle sorte qu’elles 
revêtent le même aspect (i.e. qu’elles soient manifestement covariantes) dans des 
changements arbitraires de systèmes de coordonnées ? 

2. Commençons par le premier problème et étudions le changement de système 
de coordonnées en M. On passe de la base {e,, } à la base {e’,,} en M à l’aide de 
relations du type 


eu = a,” & (3.71) 


e,=a,’e',, (3.72) 
qui entrainent immédiatement la contrainte 


ap “alò = p>. (3.73) 


Considérant maintenant un point infiniment voisin M + dM, on a 


dM = e, dz” (3.74) 


= e „ dg” (3.75) 
avec e,, = 0, Mete’ ,, = aM. La comparaison de ces deux relations montre que 


da = M Ox” = Ox” 


v Izn ep are (3.76) 
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d’ot il découle que 


> OT 
ap” = SE (3.77) 
Ox!” 
Poe 
a,” = Sgi (3.78) 
et donc que 
Ox” Ox'" 
a pce 
ai aight 6x (3.79) 


À ce stade, une convention extrêmement utile doit être indiquée et nous 
l’emploierons souvent dans la suite. Afin de ne pas spécifier chaque fois la nouvelle 
variable (la nouvelle coordonnée), nous utiliserons des indices primés; ainsi, au lieu 
d'écrire a,” eta’ , ” nous écrirons plutôt a,” et a, ”’. Avec cette convention, on 
écrira, par exemple, la relation (3.71) comme 


ep” = Qu x €r, (3.80) 


et la relation (3.73) comme 


GF a SO: (3.81) 


A partir de l’invariant ds? = dM? = dM.dM, on trouve que 


ds? = e,dzr'.e,dz” (3.82) 


= e,.e,dz"dz" , ` (3.83) 


et une relation semblable avec les nouvelles variables et les nouveaux vecteurs de 
base. Comme, par définition, le tenseur métrique g,,, est donné par 


Juv = Cher , (3.84) 


il s’ensuit que la loi de transformation du tenseur métrique est 


0x" Ox" 

Ipv = Oak Ox” Got (3.85) 
Ox Ox? 

Spit = Bet! ðr” 9d0- (3.86) 
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Les composantes g,,, du tenseur métrique 7 représentent la géométrie de l’espace 
de Minkowski dans un système de coordonnées déterminé; celle-ci peut varier et 
Pon doit donc toujours pouvoir trouver un système de coordonnées qui les ramène 
à Qu. 

3. Par définition dz” se transforme, dans un changement de coordonnées 
curvilignes, comme un quadrivecteur contravariant : 


dx" , (3.87) 


les coefficients de la transformation se réduisant aux transformations de Lorentz si 
l’on utilise des coordonnées lorentziennes. 

De même, si y(x) désigne une fonction scalaire, alors 3 y(x) se transforme 
comme les composantes d’un quadrivecteur covariant; on a, en effet, 


_ deta(s)} axl” 


DORE tee Re (3.88) 
= oe Ap (x) ; (3.89) 

c’est-à-dire, encore, 
up = vp oe ; (3.90) 


Le tenseur métrique se comporte donc bien comme un tenseur deux fois 
covariant, relativement à ces transformations. Un quadrivecteur A aura pour 
composantes contra- et co- variantes A” et A, dans la base des {e,,} : 


A= Ale, (3.91) 


Ay = A.e,. (3.92) 
exactement comme dans le cas lorentzien habituel. Il faut noter que les relations 


précédentes sont valables seulement en un point donné. Etant donnés deux quadri- 
vecteurs A et B quelconques, leur produit scalaire sera donné par 


A.B = e,.e, AB (3.93) 


= gy AB” , (3.94) 


de la méme maniére que précédemment. On aura également 
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AM = g A, (3.95) 


Ay = Quy A” (3.96) 


où g”” est “inverse” de gu, : 


mineur de Qu 


pv Sf B+v — r — 
g (-1) déterminant de g,,, 


(3.97) 


avec 


Qua-9°” = bn” . (3.98) 


La covariance manifeste des lois de la physique va donc également trouver à 
s’exprimer au moyen de tenseurs, etc., ou d’égalités entre tenseurs, etc., par rapport 
aux transformations de systèmes de coordonnées généraux. 

Nous avons vu un peu plus haut que le gradient d’une fonction scalaire est bien 
un quadrivecteur; en est-il de même du gradient d’un quadrivecteur ? D’un tenseur? 
Pour le voir, examinons la différentielle d’un quadrivecteur A : 


dA = d{Ate,} (3.99) 

ou encore 
dA = dA".e, + A” de, (3.100) 
= 0, A" dz” e, + A” dey. (3.101) 


Dans le cas de coordonnées lorentziennes, de, = 0 et 8, A“ se comporte 
comme un tenseur de rang deux. Par contre, dans le cas de coordonnées curvilignes 
générales, de,, Æ 0 et ce terme supplémentaire va avoir pour conséquence la non- 
tensorialité de 0, A”. On a, en effet, dans un nouveau système de coordonnées 


ð Ox 
Or'* ð Ort 
~ Oa" ale pa A` ep}. (3.103) 


On voit alors apparaître un terme supplémentaire, qui contient l'expression 
suivante : 
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o?r” 
Ox'2 0x"? ? 

qui serait nulle dans le cas de transformations de Lorentz. 

A quoi cela est-il dû? Pour le voir, il suffit de remarquer que la variation de 
A* contient à la fois la variation due au transport du quadrivecteur A, de M en 
M + dM, et celle du repère {e,, }. C’est pourquoi il convient de définir une notion 
covariante de dérivation, qui tienne compte de la variation absolue des vecteurs, 
des tenseurs, etc. 

4. Nous définirons donc la dérivée covariante V „ d’un quadrivecteur A” à l’aide 
de la relation suivante : 


(3.104) 


dA Z % V, AY dx”. (3.105) 


La structure même de cette relation montre clairement que 


Or” Oat 
K — pt 
V, At = Aa” ‘bar Vy A", (3.106) 
autrement dit, V, A” est bien un tenseur. Remarquons qu’une notation courante et 
très commode est la suivante : 


V, A= 4, (3.107) 


ô, A! 


I 
> 

T 
8 


(3.108) 


Pour évaluer la dérivation covariante V _, il est nécessaire de calculer l’accrois- 
sement de, dans la base {e,, }; soit 


de, = Wy” e, (3.109) 
où wp” est linéaire en dx*, 
wy” = Lio d2”. (3.110) 


Pia est la connexion — ou plutôt, les symboles de connexion — qui permet(tent) de 
comparer des directions en des points infiniment voisins et donc de comparer deux 
bases voisines. 

En remplaçant ces dernières relations dans la définition (3.101), il vient succes- 
sivement 


dA = 0,A* dz’ e, + A" T a dre, (3.111) 


= {Ə A” + TH A`} e, dr”, 3.112 
AV H 
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où l’on est passé de la première égalité à la seconde en effectuant les substitutions 
d'indices : v — u, a> v,  — À. Il vient alors 


V,A# = ðA" + T4, AX. (3.113) 


Il reste encore à évaluer les symboles de connexion I’, . Vérifions d’abord que 
les symboles de connexion sont symétriques par rapport aux deux indices inférieurs : 


= Te. (3.114) 


Cela résulte de la définition (3.110) pour les T% a> du fait que ô M = e, et du 
théorème de Schwarz 0,,0,M = 0,0,,M. On a ainsi 


8,8,M = TS, eg (3.115) 
8,0,M = TS, ea, (3.116) 


qui entraînent bien la symétrie des T`. Pour calculer explicitement les I, il suffit de 
partir de la différentielle du tenseur métrique 


dgur = d(ey.e,) (3.117) 
= {Po + TA gua} da” (3.118) 
= Op Juv dx? ; (3.119) 


ce qui entraîne l’égalité 
3p Juv = Tp TO due (3.120) 
Changeons d’indices y — p, puis v — p; il vient 
Loe grav + Noh Gpr = Ou Gov (3.121) 
a Done Or Jup- (3.122) 


Effectuant la somme des deux premières relations et soustrayant la dernière, il 
vient, en utilisant la symétrie des T 
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Le: Xp = ; {Ou Jup + Ov up — Op Gur} 
= Puvp- (3.123) 
Contractant maintenant cette dernière équation avec g®?, on obtient finalement 
Viv = ; GP {Ou up + Ov Gup — Op nv} (3.124) 


Les Tuv, et Ey s'appellent les symboles de Christoffel de première et de 
seconde espèce, respectivement. On les dénote parfois 


Purvo == [uv, p] (3.125) 
ee 
P w= te (3.126) 


On définira la différentielle absolue des composantes A” d’un quadrivecteur A 
par comparaison de la différentielle 
dA = d(e, A) (3.127) 


et de e, Vy A" dz”, c’est-à-dire par 


VAY = V, AP dx”. (3.128) 


Les considérations qui précèdent s’appliquaient à des contravecteurs. Pour les 
covecteurs, on obtient des résultats très analogues à l’aide de méthodes semblables. 
Ainsi, on trouve aisément 


Vv An = Ov An — TA, An. (3.129) 
Pour un tenseur T quelconque de composantes T” “ .. , on obtiendra 
Vo ue OT EET SEP yr oe E 

=A ak a TAT eee eae (3.130) 


cela n’a rien d’étonnant puisqu’un tenseur peut étre considéré, du moins du point 
de vue de ses propriétés de transformation, comme un produit (tensoriel) de 
quadrivecteurs. 
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En ce qui concerne le tenseur métrique g,,,, on trouve ainsi l’expression 


Vo uv = Op Gu — Fip Guo = Lo Guo = 0, (3.131) 


compte tenu de l’expression explicite pour les symboles de Christoffel de seconde 
espèce. C’est le théorème de Ricci. 

5. Revenons maintenant à la covariance manifeste des équations de la physique 
dans les changements de coordonnées d’espace-temps généraux. En pratique, les 
indices lorentziens seront simplement changés en indices généraux et les dérivées 
partielles en dérivées covariantes. Par exemple, les équations de Maxwell s’écriront 


V, F” = 4m J” (3.132) 


V,*FWw = 0, (3.133) 


tandis que les équations de base de l’hydrodynamique relativiste s’écrivent main- 
tenant | 


V, Jt = 0 (3.132) 
i 


V TŽ = 0. (3.135) 


[Chap. 5]. 
6. Appliquons les résultats qui précèdent aux mouvements inertiels, c’est-à-dire 
à ceux d’observateurs galiléens. On pourrait partir de l’équation du mouvement 


ah 
5 =e (3.136) 


et passer à des coordonnées curvilignes arbitraires {x'}; il est cependant plus 
instructif de procéder autrement, à partir de leur définition en tant que mouvements 
géodésiques dans l’espace de Minkowski. Nous partirons donc de la définition des 
géodésiques passant par deux points donnés À et B 


B 
5 | dr = 0 (3.137) 
A 


avec dr = {guv da“ dx” } 1/2 en coordonnées arbitraires. Si £ désigne un paramètre 


quelconque le long d’une géodésique (ici une droite du genre temps), on aura encore 


B 
dr 
ef —d£ = 0 3.138 
avec 


H v) 1/2 
is = | ee } | (3.139) 


Se de de 
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On a alors successivement 


B 
| dr = 
A 


p 1 dé dz” dx” d (dé dx" a 
fat - & (Soe GE) } 


dŒ dz” 
pS yT 


ar 9 “ag ° 


= 0. (3.140) 


B 


Le dernier terme provient d’une intégration par parties et est nul, compte tenu 
de ce que les points A et B sont fixés (on recherche les géodésiques passant par A 
et par B). De la relation (3.140) et de l’arbitraire des variations x", il s’ensuit que 


d? xh n py dar dx? > dr dE dr 
dé? ` °P dé dé dE dr? dé 


= 0: (3.141) 


et, en choisissant maintenant, c’est-à-dire après variation, un paramétrage du type 
a€ +b = 7, il vient 


dx dx? dx® Vu” 
MALE oy ee = 0, 142 
dr? à P Gr dr dr (3 ) 


c’est-à-dire l'équation des géodésiques. Dans cette équation Vu"/dr est une 
dérivée covariante le long du mouvement. 


EXERCICES 


1. Soient K et K’ deux repères galiléens animés l’un par rapport à l’autre d’une vitesse v = (v,0,0). 
Soient T“” les composantes d’un tenseur dans le repère K. Donner les composantes T°? et T’?? dans 
le repère K’. Donner les composantes T”? ; et T? 3. 


2. Soit A#” un tenseur d’ordre 2. Montrer que A“ „=A, . 


3. Soient A” et B” deux quadrivecteurs. Vérifier que les équations suivantes ne sont pas covariantes : 
()A*=1/B*, Gi) A°=B?, (iii) A°B'=A!B?. 


4. Soient A#” et B#”® deux tenseurs. Montrer que A, B’”® est un quadrivecteur. 
5. Soit T“” un tenseur symétrique (resp. antisymétrique). Montrer que T,» l’est également. 


6. Soient S, et A#** deux tenseurs, respectivement symétrique et antisymétrique dans les indices 
p et v. Montrer que S#” Apv *=0. 


7. On considère dans R le tenseur A;;—6:;—kik;, avec kik*=1. Montrer que Aj; est un 
projecteur 6. Sur quel sous—espace? 


6. On rappelle qu’un projecteur P est une opération linéaire hermitienne, et telle que P?=P. 
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8. Soient u” et n” deux 4-vecteurs tels que u“n,,=0 et u“u,, =+1.Lequel est du genre temps? Du 
genre espace? On pose IT#” =autu’ +bn”n” +cn” + d[u“n” +u’n“]. A quelles conditions ce 
tenseur est-il un projecteur? Sur quel sous—espace? 


9. Dans R”, soient deux tenseurs S“” et A”” respectivement symétrique et antisymétrique. Combien 
possèdent-ils de composantes indépendantes ? 


10. Soit K,,,a, * un tenseur symétrique en (pa) et antisymétrique en (v8). Combien possède-t-il 
de composantes indépendantes ? 


11. Soit R,...8 un tenseur symétrique dans |’ échange (uv) (a8), antisymétrique dans les échanges 
pov Où ae et vérifiant >. Ryufvag) = 0, où la somme est étendue aux permutations circulaires des 
indices (v,æ,B). Les indices y v,a, B varient de 1 à n. 


(i) Soit z,, un tenseur symétrique. Vérifier que le tenseur {zyo Zup — Zup Zva } Satisfait 
aux conditions de symétrie de R,,08. 


(ii) Calculer le nombre de composantes indépendantes du tenseur Ryvag- 


(iii) Donner la forme la plus générale du tenseur R,,.8, sachant que l’espace est isotrope 
et homogène. 


12. Démontrer la relation (Ey Y = npa n”Ê Le *. 


13. Montrer que le tenseur de Levi-Civita «#”** est bien un tenseur lorsqu’on se limite aux trans- 
formations de Lorentz orthochrones. Comment ce tenseur ce transforme-t-il dans les transformations 
T et/ou P? 


14. Calculer dans R° l'expression €;;, a7 b”, où a? et b? sont des 3-vecteurs. 
15. Soient A” et B” deux 4-vecteurs et soit C# un pseudo—4—vecteur. 
(i) Trouver tous les tenseurs d'ordre 2, symétriques formés à l’aide de A”, B*, C#, etc. 
(ii) Idem mais antisymétriques. 
16. Dans le plan euclidien R?(O,;x,y ; 6:;) on considère les coordonnées polaires 
ZT =rcos ¢ 
y =rsin ¢. 
(i) Indiquer les courbes—coordonnées et donner les e», eg correspondant à z” = r et x? = ¢. 
(ii) Trouver les composantes du tenseur métrique gi; (r,¢) dans ce système de coordonnées. 
(iii) En déduire les symboles de Christoffel r}. 
(iv) Calculer V; Vt A dans ce système de coordonnées, où A est un champ scalaire. 


(v) Calculer (Vi Vj = V3 Vi)A. 
(vi) Mémes questions qu’en (iv) et (v) lorsque A est un champ vectoriel de composantes Ai. 


17. Mêmes questions en ce qui concerne les coordonnées sphériques dans Rê : 


x =rcos ¢sin@ 
y =rsin psin® 
z =rcos 6. 


18. Mêmes questions en ce qui concerne l’espace de Minkowski à deux dimensions d'espace et les 
coordonnées polaires relativistes : 


x =7cos¢shx 
x =T sin sh x 


æ =Tchx 
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[on se limitera à des points d’espace-temps situés à l’intérieur du cône T+ (0)]. 


19. On considère maintenant dans R un cylindre de rayon a et d’axe Oz. Sur ce cylindre on adopte 
les coordonnées (¢,z) suivantes : 


x —acos $ 
y =asin¢ 
Z =: 


(i) — (v) Mêmes questions qu’en 16. 
(vi) Ecrire l'équation des géodésiques. 


20. On considère dans R° une sphère de rayon a et de centre O. 
(i) — (v) Mémes questions qu’en 16. 
(vi) Mémes questions qu’en 16 mais en utilisant les coordonnées polaires définies en 18 avec 
a=r. 
(vii) Quelles sont les géodésiques de la sphère? Ecrire l’équation d’une géodésique quel- 
conque. Ecrire puis résoudre l’équation des géodésiques. 
21. Mêmes questions qu’en 20 mais en ce qui concerne la “pseudo-sphère” d’équation x°?—x? = 
a? (a = const.). 


22. Dans l’espace de Minkowski, on considère les coordonnées 


€ =t- 
n =t+z 
Yy =y 
z =z 


Calculer le tenseur métrique dans ce nouveau système de coordonnées. Calculer les nouveaux 
vecteurs de base en fonction des anciens. De quel genre sont les 4—vecteurs eg et e,? Sont-ils 
orthogonaux ? 


23. Montrer que l'équation des géodésiques peut encore s’écrire 


de [ous SE] — F Ou gan de SE =o. 


CHAPITRE 4 


La gravitation 
et la Relativité Restreinte 


Dans tous les phénomènes de I’ astronomie, la gravitation joue un rôle primordial. 
A grande distance, les forces de gravitation — quoique plus faibles que les forces 
électrostatiques — l’emportent sur ces dernières : la matière est électriquement neutre 
et les forces électrostatiques ! sont écrantées; par contre, il n’existe pas de masse 
négative et la gravitation agit arbitrairement loin. On conçoit donc qu’en cosmologie 
par exemple, les forces de gravitation vont déterminer très largement l’évolution 
de l’Univers et, entre autres, celle du facteur d’échelle R(t) qui la caractérise. Bien 
entendu, l’état de la matière (son mouvement, son énergie, sa composition, etc.) 
contribuera également à cette évolution, notamment dans la mesure où il influera 
sur la gravitation. 

Ce point, fondamental, nécessite quelques explications. Si nous considérons 
un corps de masse M et de taille caractéristique R, nous pouvons à l’aide de la 
constante de gravitation G former une vitesse caractéristique 


de ey. | (4.1) 


que l’on peut interpréter, par exemple, comme une “vitesse de libération”. On 
conçoit alors que, lorsque cette vitesse va être de l’ordre de c, la vitesse de la 
lumière, 


GM 
Re? 
les effets relativistes vont jouer un rôle important dans la description théorique des 
phénomènes considérés. Le paramètre gravitationnel GM/ Rc? peut encore être 
interprété comme étant égal au rapport de l’énergie potentielle gravitationnelle du 


LL ON 


système considéré à son énergie de masse : 


u~e ou ~1 (4.2) 


1. Dans les planétes, il peut arriver que les forces électrostatiques soient comparables aux forces de 
gravitation [voir à ce sujet l’intéressant article de J.M. Lévy—Leblond (1969) et les références citées]. 
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GM _ énergie potentielle GM? 1 
Re? — énergie de mase R Me ` 


(4.3) 


Là encore, on se rend compte de la nécessité de disposer d’une théorie relativiste de 
la gravitation si l’on souhaite pouvoir considérer les phénomènes pour lesquels le 
paramètre gravitationnel n’est pas négligeable. La relation (4.3) montre également 
que les contributions énergétiques diverses à la masse M (et notamment l’état 
physique du système, en y incluant ses mouvements internes ou non) vont jouer un 
rôle important dans la théorie relativiste de la gravitation. 

Le tableau 4.1 donne quelques ordres de grandeur du paramètre gravitationnel. 


Objet Masse Taille GM/Rc? 
Noyau 10-732 107 tcm 10788 
Atome 107?3g 107cm 10743 
Homme 105g 107cm 10725 
Terre 6x1027g 6x10$cm 107° 
Soleil 2x10%?g 7x101cm 1076 
Galaxie 10442 1075cm 1077 
Naines Blanches 2x10%g 10°cm 3x1074 
Etoiles à neutrons 2x 105% 10$cm 3 
Univers si 
Trous noirs (?) 1 


Tableau 4.1 : Quelques valeurs du paramètre gravitationnel GM/Rc?. 


On constate que les objets astrophysiques dont F étude nécessite la connaissance 
de la Gravitation Relativiste sont les étoiles à neutrons, F Univers, les (éventuels) 
trous noirs. L'étude de ces objets constitue l Astrophysique Relativiste. Ajoutons 
encore que les théories relativistes de la gravitation prédisent toutes ľ existence 
d’ondes gravitationnelles, non encore observées directement, et qui elles aussi 
ressortent de |’ Astrophysique Relativiste. 

Parmi les diverses possibilités théoriques d’une description relativiste de la 
gravitation, la Relativité Générale d’Einstein est la première (qui soit compatible 
avec l’expérience) et aussi la plus simple. A ce jour, il existe un grand nombre de 
théories concurrentes dont beaucoup ont déja été éliminées par une précision accrue 
de tests classiques ou par de nouveaux tests ou de nouvelles données astrophysiques 
(notamment, celles fournies par le pulsar double PSR 1913+16). En outre, des 
arguments théoriques trés divers vont dans le sens de la Relativité Générale. 

Dans ce chapitre, nous allons examiner rapidement ce qu’apporte, ou peut 
apporter, le mariage de la gravitation newtonienne et de la Relativité Restreinte. 

Un élément essentiel de la Relativité Restreinte est qu’à toute énergie est associée 
une masse (E = mc”) et réciproquement. Il en découle que désormais tout pèse! 
La loi d’attraction universelle de Newton, 


= —G— A 
F Gr, (4.4) 
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implique, en effet, |’ attraction gravitationnelle de toute forme d’ énergie, que celle— 
ci corresponde à une masse newtonienne usuelle, à de l’ énergie électromagnétique 
ou a la gravitation elle-méme! Les conséquences de ce phénoméne nouveau vont 
être très profondes et seront étudiées au chapitre 7. Nous allons cependant examiner 
quelques conséquences possibles de l’équivalence relativiste masse/énergie et de la 
gravitation, à l’aide de raisonnements approximatifs; néanmoins, ces raisonnements 
permettent de mettre en lumière de manière simple les processus physiques à la base 
de la Relativité Générale. Nous examinerons donc successivement : (i) le décalage 
gravitationnel vers le rouge, (ii) la courbure des rayons lumineux, (iii) l’avance du 
périhélie de Mercure et (iv) la nécessité d’équations non linéaires pour décrire la 
gravitation relativiste. 


Le décalage gravitationnel vers le rouge 


Considérons un photon émis dans un champ de gravitation, par exemple à la 
surface d’une étoile, et observons-le à l’altitude zı au-dessus du point d'émission 
d'altitude zp [Fig. 4.1]. Le photon est émis avec une fréquence vo. A cette fréquence 
vo correspond une énergie hvo et donc une masse m = hvo/c?. 


< 


| 


Figure 4.1 : Décalage vers le rouge de la fréquence d’un photon dans un champ gravitationnel. Le 
photon “dépense” de l'énergie, contre la gravitation, pour grimper à l'altitude z1. 


Pour atteindre l’altitude 21, le photon doit dépenser contre la gravitation une 
énergie 
AW = mAU, (4.5) 


où AU est la variation du potentiel de gravitation entre le point d'émission et le 
point d’observation du photon : 


GM GM cou 
R+2 R+2 R? 


(M est, par exemple, la masse de l’étoile considérée). A l'altitude où le photon est 
observé, il possède donc une énergie E 


AU = 1 zo) i (4.6) 


E=E-AW, (4.7) 


où Eo = Avo et E = hv. On a donc 
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v=m | -S| <n; (4.8) 


il y a donc rougissement du photon. Le décalage spectral Z est alors donné par 


Av AU GM 
= = = 5 = (z1 — 20). (4.9) 


Z Lee 
v c2 R2c2 


Ainsi, le décalage spectral d’un photon émis à la surface de l’étoile, comparé au 
cas de l’absence de gravitation, est donné par 


GM 


Z=—>. 
Rc? 


Bien entendu ce raisonnement n’est nullement rigoureux et n’a d’autre valeur 
qu’heuristique : le photon est sans masse, bien que tout se passe effectivement 
comme si son énergie /c? était susceptible d’ interaction gravitationnelle — on voit 
apparaître le fameux paramètre gravitationnel GM/Rc? comme on s’y attendait. 
Ce décalage spectral a effectivement été mesuré, sur Terre d’abord [R.V. Pound 
et G.A. Rebka (1960)], puis sur le rayonnement émis au centre du disque solaire 
[R.V. Pound et J.L. Snider (1964)], enfin dans les naines blanches [J.L. Greenstein, 
J.B. Oke et H.L. Shipman (1971)]. Toutes ces mesures confirment la relation 
précédente, relation que l’on peut également déduire de la Relativité Générale. 
Nous verrons que ce décalage spectral vers le rouge peut également être utilisé 
comme argument [A. Schild (1967)] en faveur d’un espace-temps courbe. 


La courbure des rayons lumineux 


Une autre conséquence de l’équivalence masse—énergie, de la “masse” du 
photon, est que celui-ci ne se propage plus exactement en ligne droite! Il est 
sensible à la présence de masses importantes, comme celle du Soleil. 

La figure 4.2 montre comment la lumière émise par une étoile est déviée par le 
Soleil lorsqu'elle passe suffisamment près. Ainsi, en mesurant les positions d’une 
étoile à une époque où sa lumière est défléchie par le Soleil et à une époque où ce 
n’est pas le cas, on doit pouvoir constater une déviation dans sa position angulaire 
apparente. C’est effectivement ce qu’on observe (les premières observations, par 
comparaison de plaques photos, datent de 1919) [J. Eisentaedt (1986)]. 

Nous allons maintenant évaluer l’ordre de grandeur de cet effet en imaginant 
que le photon possède bien une masse hv /c? et une impulsion Av/c. On a alors 
affaire à un simple problème de Kepler [voir la figure 4.3 pour les notations] et, en 
coordonnées polaires (y, r), l'équation de la trajectoire (hyperbolique) du photon 
soumis à l'attraction du Soleil est donnée par [voir, par exemple, L. Landau et 
E. Lifschitz ou H. Goldstein (1960)] : 
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position apparente LT i 


“ 
2 


" position réelle 


Terre ÈS : $ 
rayon lumineux observé 


Figure 4.2 : Courbure des rayons lumineux au voisinage du Soleil. 


Figure 4.3 : Courbure des rayons lumineux au voisinage du Soleil. Notations utilisées dans le texte. 


T T: 


L 
ef i eas a (4.10) 


2m. |E- garara =, ie 


dont on déduit immédiatement la déviation 64 pour un photon “rasant” la surface 
du Soleil : 


se L dr 
6p = 29 -T = | = a (4.11) 
R m L2 
aE 
où L est le moment cinétique ? du photon, L = m, Roc, et où Yo est l’angle y 
lorsque le photon est à la distance minimum du Soleil. D’autre part, l’ énergie E 
étant conservée, on a encore 


2. Le moment cinétique du photon est Lg =bm.c, où b est le paramètre d'impact. Strictement parlant 
b#Ro, mais comme la déviation est très faible, b est très peu différent de Ro. Il convient de se souvenir 
que la déviation indiquée sur la figure 4.2 est très fortement exagérée. 
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2 2 
pa | (4)? ,2 (de)?] _ GMom, 
2 dt dt r 
Mm GMom, 


= : 4.12 
22 Ro (212) 


Les équations (4.10) à (4.12) donnent finalement 


oe 2GMo > 2GMo 
bc? Roc? | 
En fait, la Relativité Générale fournit une valeur double, précisément celle qui 


est observée : nous verrons que cela est dû à la nécessité de tenir compte du caractère 
“relativiste” du photon .... 


L’avance du périhélie de Mercure 


A la fin du siécle dernier, les observations du mouvement de Mercure montraient 
que son périhélie avançait de 43” d’arc par siècle. Il s’agissait là d’une avance 
résiduelle, non expliquée dans le cadre de la mécanique newtonienne [Chap. 1]. En 
fait, pour qu’il y ait avance —ou retard— du périhélie, il suffit que la loi d’ attraction 
universelle soit différente, même très peu, de la loi en 1/r? : on sait, en effet, que 
les seules forces centrales susceptibles de donner des trajectoires fermées sont des 
forces en 1/r? ou en r. H s’ensuit que toute modification à la loi de Newton va 
entraîner une variation du périhélie. 

La relativité va fournir deux telles modifications. D’une part, les corrections 
relativistes usuelles (i.e. en v? /c?), et d’autre part, l’énergie du champ de gravitation 
vont pouvoir expliquer, à la fois qualitativement et en ordre de grandeur, cette 
avance du périhélie de Mercure. Si nous appelons Mop et Mp les masses au repos 
et en mouvement d’une planète, on a évidemment 


Mop 


Vive 


qui donne la première correction. Le champ gravitationnel (qui occupe un volume 
sphérique de centre le Soleil et de rayon r, la distance à la planète considérée) 
possède une énergie, donc une masse, qui vient s’ajouter à celle du Soleil. La 
densité d’énergie pg du champ de gravitation est donnée par 


Mp = (4.13) 


2 
P& = — wy (4.14) 
= La (4.15) 


8rr4 
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par analogie avec le cas électromagnétique (remarquer le signe moins dans ces 
deux dernières équations, qui exprime que l’interaction gravitationnelle entre deux 
masses est attractive, contrairement au cas électrostatique où deux charges de même 
signe se repoussent). Dans ces conditions, la planète ne subit pas l’action de la 
masse du Soleil uniquement mais aussi celle qui est due à l’énergie du champ de 
gravitation; soit 


MÈG 
2re2 ` 


Le calcul se poursuit alors sans difficulté particulière [R. Sex] et H. Sex! (1979)], 
en écrivant la conservation de l’énergie en ne conservant que les termes à l’ordre 
v? /c et par une estimation de v? à l’aide d’ orbites à peu près circulaires : 


M(r) = Mo + 


(4.16) 


1 GM 
3 Mpv? — Mp eM) =E (4.17) 
(conservation de l'énergie) 
Mp = Mop + 5 Mopv [co + (4.18) 


(ordre v? /c?) 


Mopv? À GMop Mo = 2 GMo 


r r? r 
(orbite circulaire) 


(4.19) 


Incidemment, on peut remarquer que les corrections apportées par l’énergie du 
champ gravitationnel sont du même ordre de grandeur que celles en v?/c?;, en 
effet, v?/c? ~ GM/rc?. Reportant maintenant tous ces résultats dans |’ équation 
de conservation de l’énergie (4.17), il vient 


MorMo 3G2MopM2, 
r Ar2¢? 


1 
E= 2 Mopv? G (4.20) 


qui montre qu’à I’ énergie usuelle s’ajoute un potentiel supplémentaire Vs(r) 


3 GMo R GMoMop 
4 R r r l 
Lavance du périhélie 6V de la planète sera grosso modo de l’ordre du rapport 


entre le potentiel newtonien et le potentiel dû aux diverses corrections relativistes, 
c’est-à-dire 


Vs(r) = (4.21) 
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ôt Vs _ 3GMo 
27 Vy 4 Re ` 
En Relativité Générale on trouve un effet quatre fois plus important; néanmoins, 


le raisonnement grossier ? précédent fournit à la fois l’ordre de grandeur de l'effet 
et son sens (une avance et non un retard). 


(4.22) 


Nécessité d’équations non linéaires 
pour la gravitation 


L’équation de Poisson fournit le potentiel gravitationnel classique V en fonction 
de la densité de masse p, 


AV = 4nGp. (4.23) 


Cependant, dès lors que l’énergie, sous toutes ses formes, est équivalente à de la 
masse grave, il nous faut inclure dans p toutes les densités de masse correspondantes, 
y compris celle du champ de gravitation pa, 


(vv)? 
= — >— 5. 4.24 
Pa 8r Gc? (4.24) 
L’équation de Poisson s’écrira donc maintenant 
2 
AV + wy) = ATG Pmat - (4.25) 


Cette équation est non linéaire, ce qui exprime que le champ de gravitation 
est couplé avec lui-méme. Bien entendu, cette équation n’est ni manifestement 
covariante, ni méme relativiste : elle nous donne simplement une idée de ce 4 quoi 
nous devons nous attendre. Si l’on souhaite trouver une équation relativiste, on doit 
a priori effectuer la substitution À — U et aussi connaître la variance relativiste 
de V. On peut montrer que si l’on choisit pour V un scalaire, alors on trouve un 
retard du périhélie des planètes tandis que si V est la quatrième composante d’un 
quadrivecteur, on obtient une théorie où la gravitation est répulsive. Par contre — et 
c’est l’objet des prochains chapitres — un tenseur d’ ordre deux convient, bien qu’il 
ne s’agisse pas là de la seule possibilité. 


3. On trouvera un calcul général dans L. Landau et E. Lifschitz, Mécanique. 
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EXERCICES 


1. Compte tenu du potentiel perturbateur évalué dans ce chapitre, 


3 GMo R GMo Mop 
T 


Vst) =- 4 Re T 


, 


calculer exactement l’avance du périhélie de Mercure (cf. L. Landau et E. Lifschitz, Mécanique; exercice 
n° 10; chapitre 1]. 


2. Expliquer la relation (4.16) : quelle masse mesure-t-on effectivement? Commenter. 


CHAPITRE 5 


L’électromagnétisme 
et l’hydrodynamique relativistes 


Deux questions importantes restent à discuter. Il nous faut d’abord établir que 
l’électromagnétisme possède bien l’invariance de Lorentz exigée par le principe de 
relativité d’Einstein et, entre autres, trouver la forme manifestement covariante des 
équations de Maxwell. Ensuite, il est nécessaire de donner les notions élémentaires 
d’hydrodynamique relativiste dont l’usage est constant aussi bien dans l’étude 
des étoiles denses que dans celle de leur effondrement gravitationnel, voire en 
cosmologie. 


Densités et courants 


Considérons un système de N particules, la trajectoire d’espace-temps de la 
i-ème étant désignée par x} (T). L'expression 


i=N 
J”(z)= ye fe [zt — x (r)] uf(r) dr (5.1) 
i=l 


représente un quadrivecteur, le guadricourant de particules. Vérifions que cette 
relation correspond bien à une densité et à un courant de particules en ce qui 
concerne la composante temporelle et les composantes spatiales, respectivement. 
Montrons-le pour la composante 0, la démonstration étant identique pour les autres ` 
composantes. On a successivement ! 


1. L'intégrale est une intégrale curviligne, le long de la trajectoire de la i-Èème particule. 


116 L’électromagnétisme et l’hydrodynamique relativistes 


i=N 
> fs f p ti(r)] oe [x — x;(7)] a dr 


J°(x) 


i=N 
D [s(t 1(0)]-6 [x=] dt 
i=l | 


i=N 
DD) 


où l’on est passé de la première ligne à la seconde en paramétrant les trajectoires 
des diverses particules avec le même paramètre, c’est-à-dire avec le temps usuel, 
et en intégrant finalement sur t. La dernière expression n’est autre que la densité 
de particules habituelle. On trouverait de même 


i=N 
I(x) = X vit) 6 [x — xi(t)] , (5.2) 
i=1 
où v est la vitesse usuelle : v = dx/dt. 

Multipliant les deux membres de la définition de J” (x) par la charge commune 
de ces particules — en admettant qu’elles soient chargées — on voit que les quatre 
quantités “densité de charge” et “courant électrique” forment un quadrivecteur. 

Quel sens physique donner à l’invariant [J#(z) - J,(æx)/ 29 De même, quel 
sens attribuer à la (quadri-) direction de J#(x)? Pour le voir et simplifier les 
notations, appelons n(x) l’invariant précédent et soit v“(x) un vecteur unitaire 
dans la direction de J” (x) : 


JF(x) = n(x) v” (z). (5.3) 


Notons d’abord que J” aussi bien que v” sont des quadrivecteurs du genre temps; 
il s’agit, en effet, de combinaisons linéaires de quadrivecteurs du genre temps de 
composantes temporelles positives : les quadrivitesses des particules possèdent bien 
cette propriété et les 6 sont bien positifs. Nous pouvons donc nous placer dans un 
repère où v” se réduit à sa composante 0 : v” = (1,0). Dans ce repère J” se réduit 
à J! = (n, 0); autrement dit, dans ce repère, le 3-courant est nul et n représente 
la densité de particules. 

Le nombre total de particules présentes dans le système — ou, si l’on a affaire 
à des particules chargées, la charge totale — se calcule en évaluant le flux de ce 
quadricourant au travers d’une 3-surface du genre espace [Fig. 5.1] : 


N= f dX, J”(2), (5.4) 


où dX, est la forme différentielle “élément de surface” [Appendice B] : 


1 
dE, = 3 Euvasdz” Adz” Adz? . (5.5) 
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Figure 5.1 : Flux de particules à travers une surface du genre espace X., Le nombre total de particules 
présentes dans le système est égal au nombre d'intersections de leurs lignes d’univers et de 5. 


Intuitivement, cela se conçoit bien. En effet, d’une part nous devons intégrer un 
quadrivecteur de manière à obtenir un scalaire : cela exige d’intégrer de manière 
covariante (donc de contracter J” par le seul quadrivecteur dont nous disposions, 
soit dX); d’autre part, le nombre total de particules du système est égal au nombre 
de points d’intersection de leurs lignes d’univers avec la 3-surface X. Il est facile 
de vérifier que si la 3-surface du genre espace choisie est définie par t = const., 
alors d5, se réduit à [Appendice B] 


dX, = (dx, 0, 0, 0) 
et ona 


I d5,,J"(2) = f Pra = N. (5.6) 


De manière générale, les propriétés précédentes sont encore vraies même si l’on a 
affaire à un système continu. Si l’on veut comprendre de manière intuitive pourquoi 
à une grandeur scalaire (comme le nombre de particules ou la charge totale) 
est associée une densité quadrivectorielle, on peut utiliser l’argument heuristique 
suivant. A la charge totale No, par exemple, est associée la densité n = No/Vo où 
Vo est le volume dans lequel le système est enfermé. Lors d’une transformation de 
Lorentz, le volume Vo se contracte et devient V = Vo(1 — v?)!/?; autrement dit, la 
densité devient n/(1 — v)!/?. Il s’ensuit qu’elle se comporte comme la quatrième 
composante d’un quadrivecteur. Il en est de même pour la densité de toute grandeur 
scalaire. 

Cette circonstance est tout à fait générale : à toute grandeur tensorielle du type 
T correspond une densité ayant un indice de Lorentz supplémentaire, soit T}. 
Ainsi, à l’impulsion-énergie P” d’un système physique correspondra une densité 
d’impulsion—énergie que l’on appellera le tenseur impulsion—énergie T”” , que nous 
étudions plus loin. L’impulsion-énergie totale sera donnée par 


pu = f as TH (5.7) 
a 


De méme, au spin correspondra un tenseur a trois indices. 


118 L’électromagnétisme et l’hydrodynamique relativistes 


Revenons maintenant au quadricourant de particules. Si l’on choisit deux 
3-surfaces du genre espace arbitraires Z et X’, il est clair qu’elles contiennent 
le même nombre de points d’intersection avec les lignes d’univers des particules : 
leur nombre est constant, du moins si l’on considère des particules stables. Pour 
exprimer cette conservation du nombre de particules (ou de la charge, ou d’une 
autre grandeur scalaire) considérons le volume d’espace-temps délimité par les 
deux surfaces X et X’ et la surface S engendrée par un tube de courant [Fig. 5.2]. 
Le théorème de Stokes [Appendice B] donne 


À drâ, J"(x) = I dX, J" (£) — i | dX j” (x) + 


+ f dS, J”(z)=0 (5.8) 


qui exprime la conservation du nombre de particules (la dernière intégrale est nulle 
car J” est orthogonal à d2’,,, au sens de la métrique de M; la seconde intégrale 
comporte un signe moins car dX, est proportionnel à la normale à X et cette 
normale est orientée vers le passé sur X”, si elle l’est vers le futur sur X). 


Figure 5.2 : Conservation du nombre de particules. Le théorème de Stokes est appliqué au volume 
délimité par un tube de courant, de surface S, et deux surfaces du genre espace 3 et =’. ng est la 
normale à S tandis que ny (resp. n yı) est la normale à 5 (resp. X’). On a choisi la normale extérieure 
à la surface du volume. 


Comme l'intégrale (5.8) est nulle [la conservation de N implique que le nombre 
d’ intersections de trajectoires d’univers sur X et sur X” soient égales; cf. Fig. 5.1] 
quel que soit le 4-volume d’intégration, il s’ensuit que l’intégrant est nul (modulo 
des conditions mathématiques réalisées en pratique) et l’on a alors 


8,J4(x) =0. (5.9) 
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En coordonnées usuelles, cette relation s’ écrit 


on 
g tes (5.10) 


c’est l’équation de continuité habituelle. 


Les équations de l’électromagnétisme 


Pour trouver la forme des changements de repère d’inertie, compte tenu de 
la constance de la vitesse de la lumière, nous avons admis que les lois de 
l’électromagnétisme conservaient la même forme dans tous les repères galiléens; en 
particulier, une onde sphérique restait une onde sphérique : cette dernière propriété 
nous avait permis d’obtenir les transformations de Lorentz. Il reste cependant à 
vérifier que les équations de I’ électromagnétisme — c’est-à-dire les équations de 
Maxwell — satisfont bien à cette condition et qu’elles peuvent notamment s’écrire 
sous une forme manifestement covariante. Pour cela, partons des équations de 
Maxwell écrites sous la forme 


V-E = 4mn (5.11) 
OE 

B - — =4 .12 

VA Ai nJ (5.12) 

V-B=0 (5.13) 
dB 

Se 9, 14 

VAE+ = = 0 (5.14) 


où nous avons regroupé les équations avec second membre entre elles et celles qui 
sont homogènes également et où l’on a adopté c = 1. Ces équations sont linéaires 
en E et B, d’une part, et d’autre part du premier ordre relativement aux diverses 
dérivées partielles 0,,. Comme n et J peuvent être regroupés en un quadrivecteur 
J", le premier groupe des équations de Maxwell doit nécessairement s’écrire sous 
la forme 


O,F# = And”. (5.15) 


Autrement dit, les champs E et B forment les composantes d’un tenseur du 
second ordre F4", Cependant, alors que E et B ont 6 composantes indépendantes, 
le tenseur F en possède a priori 16. Ce tenseur doit donc posséder des propriétés de 
symétrie particulières; notons, à cet égard, qu’un tenseur antisymétrique du second 
ordre, dans l’espace de Minkowski, possède 6 composantes indépendantes. En fait, 
la conservation de la charge électrique, 
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ðJ = 0, (5.16) 


impose que l’on ait 


ðm F” = 0, (5.17) 


et ce, quel que soit le tenseur champ électromagnétique F. Il s’ensuit que ce 
tenseur est antisymétrique, puisque 0,,, est symétrique. Pour trouver les différentes 
composantes de F en fonction de E et B, il suffit d’identifier le premier groupe 
d’équations de Maxwell avec l’équation covariante (5.15). On trouve alors 


0 -E, -E, -E3 
E 0 -Bs Ba 
E2 Bz 0 -Bı 
E3 -B Bı 0 

Les composantes F, et FF” s’obtiennent facilement en élevant et en abaissant 
les indices de F#” à l’aide du tenseur métrique nuv. 

Le second groupe des équations de Maxwell — en fait, des contraintes sur le 
champ électromagnétique — s’ obtient de manière analogue ? et s’écrit 


RFF = (5.18) 


OF = 0, (5.19) 


où * FH” est donné par 


1 
*pey = 5 E Fag (5.20) 


CF est le tenseur dual de F). En développant l’expression précédente de * F#”, il 
est facile de se rendre compte que le second groupe des équations de Maxwell peut 
encore s’écrire 


OuFyx + OF yy SF. 0) Fuv = 0. (5.21) 


En fait, ce second groupe implique ê que les champs E et B dérivent de potentiels 
électromagnétiques V et A à l’aide des relations 


B=VAA, p=-vr- SA (5.22) 


que l’on peut réécrire immédiatement sous la forme manifestement covariante 


Fuv = pAr — OvAy (5.23) 


2. Ce second groupe d’équations de Maxwell (i) est linéaire en les dérivées 0,,, (ii) est linéaire en F“” 
et (iii) ne peut s’écrire de manière manifestement covariante qu’à partir des tenseurs dont on dispose, 
c'est-à-dire nv, Fur et Euvag. 

3. Cf. Appendice B. 
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où l’on a posé A” = (V, A). Le caractère quadrivectoriel de À, est manifeste 
lorsqu’on remplace F en termes des potentiels dans l’équation de Maxwell (5.15); 
on obtient, en effet, 


OA” — OF [3 A"] = 4x J#: (5.24) 
qui indique bien la variance tensorielle de (V, A). Cette équation aurait également 
pu être obtenue en partant de la forme non manifestement covariante (5.11)-(5.14) 
des équations de Maxwell, de la définition (5.22) des potentiels et en regroupant les 
composantes de J“. L’équation (5.24) est bien covariante; en effet, les opérateurs 
Nuv et 040, possèdent bien la variance relativiste indiquée par leurs indices. 

Si l’on fait subir au quadripotentiel A” la transformation dite de jauge 


A+ — AF + OPA, (5.25) 
où À est une fonction arbitraire, on constate que le champ électromagnétique F4” 
ne change pas. La définition des potentiels laisse donc la place à un certain arbitraire 
que l’on peut lever en imposant des conditions supplémentaires 4, des conditions 
de jauge. Une telle condition est réalisée par la condition de Lorentz 


0,A¥ = 0; (5.26) 
cette condition ne suffit pas à déterminer univoquement le quadripotentiel puisqu’ une 
transformation de jauge pour laquelle la fonction A satisfait la relation 


OA =0 (5.27) 


conduit au même champ électromagnétique. Il existe, naturellement, bien d’autres 
conditions de jauge possibles. 

Revenons maintenant au champ électromagnétique. A l’aide du tenseur F et de 
son dual *F, il est possible de former les deux invariants 


FU. By et “Fov F; (5.28) 
En termes des champs E et B, ces deux invariants s’écrivent 


FY. F = 2[B? — E?] (5.29) 


‘Fy, FY = 4E-B. (5.30) 


Pour une onde électromagnétique se propageant dans le vide, ces deux invariants 
sont nuls : les champs E et B sont orthogonaux et l’onde contient autant d’ énergie 
sous forme magnétique que sous forme électrique. 


4. D'une certaine manière, lorsqu'il satisfait une condition de jauge non manifestement covariante 
comme la condition de Lorentz, A” n’est pas réellement un quadrivecteur; lorsqu’on change de système 
d'inertie, il est alors nécessaire d’effectuer aussi une transformation de jauge. 
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Le tenseur énergie-impulsion 


Nous avons considéré plus haut un système de particules identiques; sa densité 
d’énergie-impulsion est alors 


Thot = © | dr putsi — zi(r)]. (5.31) 
A l’approximation non relativiste, cette expression se réduit à 
That = D p? 6x = xi(t)] (5.32) 


où p° se réduit à l'énergie cinétique usuelle lorsqu’on néglige l'énergie de masse 
des particules et si, de plus, p“ = mu“, T” représente bien la densité d'énergie du 
système. On vérifierait de même que T”° est une densité d’impulsion, que T% est 
un flux d’énergie, que T* représente le tenseur des tensions et qu’enfin le tenseur 
TY est symétrique. 


Examinons brièvement cela d’un peu plus près. Commençons par les composantes spatiales de T4”, 
L'élément de 3-impulsion s’ écrit 


dP? =T#d>; 
=Ti à Ejnan dr" Adz* Adz ‘ 
ou encore 


aP? ~T" dr’dr"dr!. 

dP? /dz® est la force dans la direction i et dP‘ /dz? x 1/(dS=dx* dz') est la force (dans la direction 

i) appliquée à un élément de surface orienté parallèlement au plan (k,?); c’est donc bien une tension. 

Comme les équations du mouvement d’un système de particules peuvent souvent 
être déduites d’un lagrangien, y compris dans le cas relativiste [A.O. Barut (1965); 
G. Kalman (1961); A. Peres et N. Rosen (1960)], on peut constater que, malgré une 
définition différente, le tenseur énergie-impulsion des champs et des particules est 
susceptible d’une méme interprétation physique [Appendice C]. 

En général, un système physique est composé de champs [Appendice C] et 
de particules et le tenseur impulsion-énergie total est, en l'absence de champs 
extérieurs, 


Tiot = Thart t Th ` (5.33) 
Dans le cas de particules identiques chargées, la conservation de 1’ énergie et de 


l'impulsion totales du système s’ écrit 


aT =0, (5.34) 


to 


fournissant la relation de conservation 


Ə T, = An F" Jp; (5.35) 


art 
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le second membre de cette dernière équation représente le couplage entre le champ 
électromagnétique et les charges du système. 


L’hydrodynamique relativiste 


Nous donnerons maintenant quelques aperçus sommaires de l’hydrodynamique 
relativiste, nécessaires pour traiter aussi bien des problèmes de Relativité Générale 
(cosmologie, étoiles denses et trous noirs) que de questions concernant la matière 
à haute densité (collisions d’ions lourds, matière dense, etc.). 

Tout comme l’hydrodynamique newtonienne, l’hydrodynamique relativiste est 
basée sur la donnée explicite du courant de matière J” (ou, éventuellement, d’autres 
courants), du tenseur énergie-impulsion total T#” , et surtout sur des équations de 
conservation 


ðJ” =0 
(5.36) 
OUT =0. 


Un cas physiquement intéressant est constitué par ce qu’on appelle le schéma flui- 
de parfait. Dans un tel schéma, il n’ existe dans le système qu’un seul quadrivecteur, 
soit u”. Ce quadrivecteur est alors nécessairement égal à la quadrivitesse moyenne 
du fluide car le courant ne peut être que proportionnel à ce vecteur, supposé unitaire 
(mais ce n’est pas là une restriction importante); u” est donc obligatoirement du 
genre temps, comme tout quadricourant de particules. Dans ces conditions, la forme 
la plus générale du tenseur énergie-impulsion est 


T# = Autu” + By” (5.37) 


= (A+B) utu’ — BAY” (u), (5.38) 


où A” (u) est le projecteur orthogonal à u”, i.e. sur l’espace propre à la direction 
temporelle définie par u” :° 


Ap (u) = uu” — nb”. 5.39) 
H 


En effet, les seuls tenseurs symétriques que l’on puisse construire à partir du 
tenseur métrique 7”” et du quadrivecteur u” sont précisément 7” et uřu” : THY, 
un tenseur symétrique, est donc nécessairement une combinaison linéaire de ces 
tenseurs ê. Interprétons maintenant les fonctions arbitraires A et B. Dans un système 
de référence en co-mouvement avec le fluide, u” se réduit à 


5. On trouve aussi la définition A#” =n" -utu”, 


6. Remarquons que u” est le vecteur propre du genre temps de T#” ; les trois autres, du genre espace, 
sont totalement arbitraires. 


124 L’électromagnétisme et l’hydrodynamique relativistes 


u” = (1,0), (5.40) 


et les seules composantes non nulles de T#” sont 


T® =A, T°=8 (i = 1,2,3). (5.41) 


A représente donc la densité d'énergie p du système, tandis que T*) représente 
les tensions du milieu; ces tensions sont les mêmes dans toutes les directions i, le 
milieu est isotrope et B n’est autre que la pression P usuelle. Finalement, la forme 
la plus générale du tenseur énergie-impulsion du schéma fluide parfait est 


TY = (p+ P)utu” — Pr”. (5.42) 


Dans l'expression “schéma fluide parfait”, le mot “parfait” se rapporte à 
l’absence de phénomènes de transport — de phénomènes dissipatifs — comme 
la propagation de la chaleur, la viscosité ou la diffusion. Cela se traduit par le 
fait que le tenseur énergie-impulsion ne contient pas de gradient de grandeurs 
macroscopiques (de température, de vitesse, de densité, etc.). 

Le problème hydrodynamique comporte maintenant six fonctions inconnues 
[P, p, n, (où n est la densité de particules) et les trois composantes indépendantes 
de u“] qui satisfont seulement cing équations, les cinq équations de conservation 
(5.36). Il nous faut donc disposer d’une équation supplémentaire. La donnée d’une 
équation d’ état, du type 


P=P(p),  n=n(p) (5.43) 


ou bien 


P=P(n), p=p(n) (5.44) 


suffit, en principe, à résoudre le problème. Encore faut-il que cette équation d’ état 
ne soit pas bi- ou multiparamétrique. Ainsi, lorsque l’équation d’ état dépend de la 
température, il est nécessaire de disposer également d’une équation de propagation 
de la chaleur ou de toute autre relation supplémentaire. 

Il est également nécessaire de pouvoir disposer d’une thermodynamique re- 
lativiste. On peut montrer que les relations habituelles restent valables dans un 
repère local [voir, par exemple, J. Ehlers (1971) ou C.W. Misner, K.S. Thorne et 
J.A. Wheeler (1973)] et nous y reviendrons quand cela sera nécessaire. 


EXERCICES 


1. Soit F“” un tenseur antisymétrique. Calculer F# et F.,. Calculer * FH”. 
2. Soit P un 3-plan du genre espace d’équation k, 2" =const. Calculer l élément de 3-surface dX. 


3. Calculer l’élément de surface dd,, de la surface x,,x#=a?. 
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4. On considére le mouvement d’une particule de charge e et de masse m dans un champ 
électromagnétique extérieur A“ (x). L’action est donnée par 


S= f? ilndada”] + eA, (x)da"} . 

En écrivant que 5S=0, trouver les équations du mouvement correspondantes. 

5. On considère un système de N particules, de coordonnées x# (7) dans l’espace de Minkowski, et 
de quadrivitesse u} (7); i=1,2,...,N; T= temps propre. Ces particules sont identiques, de charge e et 
de masse m. Leur dynamique est définie par 

Pat (r) v ; 
m Stig) = =eF?" (x;)uir(T) i=1,2,...,N 
où F,, est le champ électromagnétique du système. On pose 
i=n 
Riau) =)) f dr 6 [wai (7)}-6 [uu (7)] 
i=] 
[r=x?, 2}, x7, x... 
(i) Montrer que le quadricourant du système est donné par 
J” (x)=e J d'u R(z,u)u" . 


(ii) Montrer que le tenseur énergie-impulsion des particules est donné par 


THY =f dtu R(x,u)mu#u” 


part 
Gii) Montrer que R(x,u) obéit à l'équation 
u” ð R(x, u)+ € FY (alu, SaF R(z,u)=0 . 
(iv) Par intégration, déduire de la relation es que 
OuJ"(x)=0. 
(v) De manière analogue, montrer que 


De Thart 74T Ju (2) FY (x) . 


6. Soient a” , b” , c trois quadrivecteurs de M. Ecrire le tenseur du second ordre le plus général qui 
soit (i) symétrique, (ii) antisymétrique. 


7. Soit F,, le tenseur champ électromagnétique. Soient u” et h” deux 4-vecteurs tels que : 
utup=1, héhy=-h?, u#hp=0. 


(i) Calculer F,, FF? et Fpp * FH”. 
Gi) Comment interpréter he et u” lorsque Fy.,=—Epvaph™ uP 
(iii) Calculer alors 


* 
h” Fur, UF Fay, ue" Fur, REY Fup . 


Interpréter. 
(iv) Calculer le tenseur impulsion-énergie du champ électromagnétique en fonction de u” 
et h”. 
(v) h” est-il réellement un quadrivecteur? 


8. On se propose de généraliser de manière covariante la loi d’Ohm usuelle J=o E. On écrira donc, 
dans le cas relativiste, une expression de la forme 
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JE = A6 Fup, 


où J” est le quadricourant et Fag le tenseur champ électromagnétique. Dans la suite, on considérera 
que toutes les grandeurs utilisées sont, en réalité, des transformées de Fourier. 

(i) Comment s’ écrit la conservation de la charge et qu’implique—t—elle pour le tenseur A“*4 ? 

(ii) Quelles sont les symétries du tenseur A“** ? Combien de composantes indépendantes 
ce tenseur possède-t-il? 

Gii) Donner la forme la plus générale de A“** compte tenu du fait qu’on ne dispose pour le 
former que de k”, le vecteur d’onde, et u”, un 4-vecteur du genre temps. 


9. Soit A“ (x) le quadripotentiel électromagnétique. On se propose d’en obtenir une équation sur la 
base des hypothèses suivantes : (i) covariance manifeste, (ii) équation du second ordre, (iii) linéarité. 
On admet, en outre, que le quadricourant J“, source du champ A“, apparaît seul au second membre de 
l’équation cherchée. 

(i) Trouver la forme la plus générale de l’équation satisfaite par A” (x). 

(ii) Montrer que cette équation est totalement déterminée dès lors qu’on lui impose d’être 
invariante de jauge et que 8, J” = 0. 

(iii) Montrer que cette équation est totalement déterminée dès lors qu’on impose que des 
ondes planes du type 


AX (2) = AP (k) e? 
soient solutions (avec J” =0), avec k?=0. 


10. Soit F“” un tenseur champ électromagnétique tel que F,,,* F“” =0. Montrer que, si F,, F” >0, 
alors il existe un système de référence galiléen où F,,, se réduit à un pur champ magnétique. Qu’en 
est-il lorsque F,,, F#” <0? 


11. Le vide est, par hypothèse, homogène (au sens de l’espace de Minkowski) et isotrope. Si on 
Passimile à un milieu matériel, (i) donner la forme la plus générale du tenseur énergie-impulsion associé 
et (ii) en déduire la forme de l’‘“‘équation d’état” correspondante. 


12. La distribution de Maxwell-Boltzmann relativiste s’ écrit 


f(p#)=24 @(p°) 5(p? —m”) exp{—Bu“p,} (1) 
et est normalisée par 
Je=f dtp B f(y) (2) 


où JF est le quadricourant de particules. 

(i) Ecrire 1’ expression (2) sous la forme d’une intégrale triple. A l’aide d’un changement de 
variables du type p°=mchx, évaluer J en fonction de A et u”, puis en déduire A. 

Gi) Expliquer et commenter la forme (1) pour la distribution de Maxwell-Boltzmann 
relativiste. Montrer que, lorsque 8m>1, la fonction 


f(p)=A exp{-Bu“p,} 


se réduit à la distribution de Maxwell ordinaire. 
(iii) On pose 


Bboy 
T” = f dép BB fp). 
Interpréter les différentes composantes de ce tenseur. Montrer qu’il s’agit bien du tenseur impulsion- 
énergie (du gaz parfait relativiste). 
(iv) Vérifier que T”” a nécessairement la forme 
THY =(p+P)ubu’— P”. 


Calculer alors la densité d’ énergie p et la pression P. Vérifier que P=n 87+, avec n?=J" Jp. 
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(v) L'énergie est-elle équirépartie entre les différents degrés de liberté? 
(vi) Calculer T“” lorsque m—0, et en déduire que P= 4 p pour des photons ou des neutrinos. 
Données : 


Kn (z) =f dx chnx exp{—xchx} 


n 


= pastamct J dxsh”xexp{-echx} 
K, 
Kn41(z)—Kn-1(x)=2n Kale) 


(Kn : fonctions de MacDonald, ou de Kelvin = fonctions de Bessel modifiées) 


E s n2_ 4n?—1)(4n?—3? 
Kale) =ÿEe {+ en + (ent L., 


pour z>1 
Kalz) = 4 (n-1)! [2]"+-- 
Ko(x) =—.5772—log gt 
pour z<i 


Ki (£) = R Kn(z)- Kn41(x). 


13. Comment s’écrit la distribution de Fermi-Dirac relativiste? Comment est-elle normalisée ? 
Calculer la pression et la densité d’énergie du gaz de Fermi complètement dégénéré à T=0°K. On 
donne 


f(x) af dtt? [14t] /?= 1 {0(1+22)9/?— 


— § [x(1+a?)'/?— log(z+(1+a?)*/?)]}. 
[Références pour les exercices 12 et 13 : J.L. Synge (1957); S.R. de Groot et al (1980).] 


14. A partir de la conservation de l’énergie et de l’impulsion, 9, T#”=0, d’un fluide parfait, montrer 
que l’on a 


dU + PdV =0. 


Justifier le fait qu'un fluide parfait est non dissipatif. 


CHAPITRE 6 


Qu’est-ce qu’un espace courbe? 


La description de la gravitation relativiste va nécessiter, comme on le verra à 
la fin de ce chapitre, l’introduction d’un espace-temps courbe. Mais qu’entend-on 
par “espace courbe”? Notre intuition, basée sur la vision de surfaces dans l’espace 
R*, peut suffire à étendre ce concept à des espaces de dimension supérieure à 
2. Aussi convient-il d'extraire l’essentiel d’exemples simples (comme celui de la 
sphère) de surfaces de R3. C’est ce que nous ferons, d’abord en étudiant quelques 
propriétés géométriques de surfaces connues puis en les comparant aux propriétés 
correspondantes du plan R*. Nous définirons ensuite la courbure de Riemann 
et nous donnerons finalement quelques arguments en faveur d’un espace-temps 
courbe. 


Quelques manifestations de la courbure 


Dans ce paragraphe, nous considérons seulement le cas d’une sphère de rayon 
R, plongée dans R? : il est indubitable qu’il s’agit bien là d’une surface courbe! 
Nous nous efforcerons alors d’y construire des figures géométriques élémentaires 
dont nous comparerons les propriétés avec celles de figures planes analogues. 

1. Triangle géodésique [Fig. 6.1] : Dans le plan, un triangle quelconque est 
formé à partir de l’intersection de trois droites non parallèles. Sur une sphère, ce qui 
joue le rôle d’une droite, c’est un arc de grand cercle : la droite est, dans le plan R?, 
le plus court chemin (géodésique) entre deux points tandis que, sur la sphère S2, 
c’est bien un arc de grand cercle. Traçons donc un triangle sur une sphère 59; entre 
deux points À et B passe un arc de grand cercle (et un seul, si la distance AB doit 
être minimale et si À et B ne sont pas situés aux pôles). Choisissons maintenant le 
point C de telle sorte que l’angle CAB soit égal à x/2. Nous pouvons également 
choisir C de sorte que CBA=7 /2 aussi. Nous obtenons ainsi un triangle dont la 
somme des angles est supérieure à T. 

Cette circonstance est tout à fait générale : dans un espace courbe, la somme des 
angles d’un triangle (géodésique) est, la plupart du temps, différente de x. 
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a — 8 


(a) (b) 


Figure 6.1 : Triangles bi-rectangles dans le plan et sur la sphére. Sur la sphére, la somme des angles 
du triangle est supérieure à x. 


(a) (b) 


Figure 6.2 : Cercle géodésique (a) et données géométriques (b) utilisées pour le calcul de son 
périmétre et de sa superficie. 


2. Cercle géodésique [Fig. 6.2] : Considérons maintenant un cercle de centre 
un point O (quelconque) de la sphère, et de rayon a. Cela signifie qu’à partir du 
point O, nous traçons tous les arcs de géodésiques de longueur a. 

Si l’on appelle 6 l’angle au centre qui sous-tend l’un des rayons du cercle 
géodésique, et ro le rayon de ce cercle dans R, on aura 


a = RO et ro = Rsind (6.1) 


avec 0 < 8 < 7/2, c'est-à-dire 0 < sin  < 1, où R est le rayon de la sphère. 
Dans ces conditions, le périmètre du cercle géodésique est 2 = 2779, tandis que sa 
surface est la surface de la calotte sphérique qu’il sous-tend, S = 27 R?(1— cos 0). 
Autrement dit, 


L= 2rRsin0 = 2rRsin = 


2 
~ 2 es oR, ats 6.2 
Ta h om T | (6.2) 
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_ 274 _ z 24 A 
S = 2r R (1 — cosb) = 2r R (1 cos +) 


2 


~ Ta? h- soe +]: (6.3) 


Les expressions précédentes de £ et S doivent être comparées avec les valeurs 
usuelles 27 et 7a”, respectivement. On constate d’abord que, si R est très grand, 
les deux valeurs sont trés voisines : une sphére de trés grand rayon est, localement, 
très semblable à un plan. Ensuite, si R < a, £ et S vont différer notablement des 
valeurs euclidiennes habituelles. C’est ce que l’on traduit parfois en disant un peu 
incorrectement que dans un espace courbe, la valeur de n n’est plus 3.14159 ---. 


(a) (b) 


Figure 6.3 : Transport parallèle (a) dans le cas euclidien et (b) dans le cas de la sphère S2. 


3. Transport parallèle d’un vecteur [Fig. 6.3] : Considérons encore deux 
triangles géodésiques, l’un dans le plan R?, l’autre sur la sphère S2. Soit maintenant 
un vecteur X dans le plan, et transportons-le parallèlement à lui-même le long du 
circuit fermé défini par le triangle. Après un tour, le vecteur X coïncide parfaitement 
avec le vecteur X que l’on avait au départ, et cela est vrai quel que soit le triangle 
considéré. Qu’en est-il dans le cas de S2? Choisissons, pour simplifier, un triangle 
bi-rectangle. Il est cependant nécessaire de s’entendre sur le sens de l’expression 
“transport parallèle”. Dans le cas euclidien, le vecteur X est toujours parallèle à 
lui-même, toutefois, cela signifie aussi que l’angle qu’il forme avec chacun des 
côtés du triangle ABC est constant. Dans le cas de la sphère, la comparaison des 
directions successives de X entre elles est beaucoup plus délicate; la direction de 
X est comparée au vecteur tangent aux géodésiques formant le triangle curviligne 
ABC. Ainsi, prenons pour X au point A, un vecteur tangent au côté AC. A partir 
de C, et ce jusqu’au point B, le vecteur X forme avec le côté CB un angle a; puis, 
à partir de B et jusqu’en A, il forme un angle a + 7/2. Arrivé en A, le vecteur X 
fait maintenant un angle non nul avec le vecteur de départ et ne coïncide donc plus 
avec lui, contrairement au cas euclidien — ceci est encore une manifestation de la 


132 Qu’est-ce qu’un espace courbe? 


courbure, comme on peut facilement le calculer en évaluant l’angle a en fonction 
de R et de la distance (géodésique) AB. 

4. Déviation géodésique [Fig. 6.4] : Considérons maintenant deux géodé- 
siques de la sphère S2, issues du même point O où elles se coupent selon un angle 
a supposé petit. Soient À et B deux points (un sur chaque géodésique) situés à la 
distance a de O et soit x la distance entre A et B, comptée sur la sphère. 


Figure 6.4 : La déviation géodésique. 


La distance x entre A et B s’évalue facilement et l’on trouve 


x = aRsind = aR sin 5 (6.4) 
1 2 
~ aa. h-j% +h (6.5) 


de sorte que la déviation géodésique x obéit à l’équation différentielle (équation 
de la déviation géodésique; voir chapitre 7) 
dx 1 


da2 Fe 


La figure 6.5 donne une idée qualitative de l’écart entre la déviation euclidienne 
K = Oetcelle qui concerne la sphère K > 0(K est la courbure); nous avons rajouté 


Kx. (6.6) 


Figure 6.5 : Ecart à la déviation géodésique selon le signe de la courbure K. 
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le cas où K < 0, sur lequel nous reviendrons plus loin. La déviation géodésique 
joue un rôle important en Relativité Générale (diamètre angulaire de galaxies, en 
cosmologie; antennes pour la détection éventuelle d’ondes gravitationnelles; etc.) 
et nous en verrons la forme covariante générale au prochain chapitre. 

5. Rectangle géodésique [Fig. 6.6] : Donnons un dernier exemple où la 
courbure se manifeste. Traçons un rectangle curviligne ABCD sur So, c'est-à- 
dire une figure comportant quatre angles droits. On vérifie facilement que si les 
côtés AD et BC ont bien mêmes longueurs, il n’en est pas ainsi pour AB et CD. 
Bien plus, l’arc DC n'est pas un arc de géodésique et, si l’on trace la géodésique 
de longueur égale à AB, on aboutit en un point C” tel que la figure ABC’D ne 
comporte plus ni quatre angles droits, ni même deux paires de côtés opposés égaux ! 
Ceci est, une fois de plus, une manifestation de la courbure. 


(a) (b) 


Figure 6.6 : Rectangle géodésique. (a) Le quadrilatére ABCD est bien un rectangle; toutefois, si AB, 
AD et BC sont bien des arcs de géodésiques, il n’en est pas de méme de CD. L’arc de géodésique issu 
de D et orthogonal à AD aboutit en C! # C : on ne peut refermer le quadrilatère! (b) La même 
situation est exprimée dans le système de coordonnées polaires (0, ©) qui permet de décrire la sphère 
So, localement. 


Courbure des surfaces à deux dimensions 


La courbure des surfaces à deux dimensions est particulièrement importante à 
établir, car c’est à partir de sa définition que l’on construit celle d’espaces courbes 
plus généraux à n dimensions. Cette courbure sera d’ailleurs définie à l’aide de la 
notion usuelle de courbure d’une courbe plane. 

A l’aide des exemples précédents — qui tous concernent la sphère Sp — nous 
pourrions être tentés de définir la courbure d’une surface soit comme l’excès (positif 
ou négatif) de longueur du périmètre d’un cercle géodésique tracé sur la surface 
considérée, relativement à un cercle euclidien de même rayon, c’est-à-dire 


Ke ies {=} | (6.7) 


a—0 T a 
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soit comme un excès (positif ou négatif) de surface [Fig. 6.7], soit d’une autre 
manière faisant intervenir la courbure par l’intermédiaire d’une propriété quel- 
conque : 


2 
Kome i =I | (6.8) 


a—0 T at 


OL 
BO 
Re 


Figure 6.7 : Excès (ou défaut) de surface d’un cercle géodésique tracé sur une surface S et “aplati” 
sur un plan euclidien R?, pour K=0, K>0, ou K <0 {d’après F. Rindler (1977) Fig. 7.3; reproduit 
avec l’aimable autorisation de l'éditeur, © Springer-Verlag]. 


Toutefois, ce genre de définition péche par un grave défaut : il utilise, en effet, 
les propriétés de symétrie de la sphére (isotropie) et n’est donc pas adapté au cas 
général d’une surface sans symétrie particulière. 

Si l’on analyse les manifestations de la courbure qu’indiquent les exemples 
précédents, il est immédiat qu’elles font toutes intervenir des propriétés métriques 
(angles, parallélisme, longueurs, surfaces, etc.) donc liées à la métrique de la surface. 
A priori la métrique définie par g;;(£!,£?) sur une surface S, à deux dimensions, 
plongée dans R°, s’écrit sous la forme 


do? = gij (EE) dë dë? (i,j = 1,2), (6.9) 


où les €* sont deux paramètres quelconques permettant de décrire la surface au 
voisinage d’un point donné. La surface S de R? est définie paramétriquement par 


1 


r = a(t, E) =r 
y = y(ét, €) = x? (6.10) 
T n 
de sorte que l’on peut toujours écrire, pour la (distance)? do? sur S : 
do? = dx? + dy? + dz? = 6;; da‘ dz 
= d[e P? + aE? + aeee 
_ a" 1 ¢2 da! 1 ¢2) gej Jek 
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d’où l’on tire immédiatement 


1 82) g 1 2 ðr! 1 ¢2 12 
gizl, E^) = ke ggi EE) ga E SE (6. ) 


Notons que g;; contient a priori trois fonctions des € î (c’est-à-dire 911, 922 et 
g12) mais comme les coordonnées des points de la surface S (ou plutôt d’une partie 
ouverte de S) sont arbitraires, il est toujours possible, dans le cas des surfaces a 
deux dimensions, de trouver localement un paramétrage {a*};-1 2 avec lequel la 
métrique prend la forme 


do? = G(a',a”) [(da!)? + (da?)’] , (6.13) 


où G est une fonction connue dès lors que la surface S l’est également. Dans ces 
conditions, la courbure d’une surface S de R? est directement liée à cette fonction 
G. En outre, aussi bien les pseudo-définitions (6.7) et (6.8) que la façon dont la 
courbure intervient dans l’équation de la déviation géodésique (6.6) montrent que 
ce sont les dérivées secondes du tenseur métrique (ou de G) qui permettent la 
définition de la courbure. Si la fonction G(a!, a?) est constante, alors la métrique 
(6.13) peut toujours se mettre sous la forme euclidienne 


do? = (dat)? + (da’)?; (6.14) 


l’espace (la surface) muni(e) de cette métrique est alors localement euclidienne, ou 
encore localement plate. Par exemple, un point d’un cylindre d’axe Oz et de rayon 
R, représenté dans R à l’aide des coordonnées cylindriques 


z =rcosé 
y =rsindg (6.15) 
D = 


est défini par le couple (£! = 0, €? = z) et possède la métrique 


do? = dz? + R?d0? = (dé)? + R?(dé!)? (6.16) 
= (da’)? + (da’)?, 


avec a! = £? eta? = RE}. 

Avant d’en venir à la courbure des surfaces à deux dimensions, rappelons rapi- 
dement comment est définie la courbure d’une courbe plane [Fig. 6.8]. Considérons 
un cercle C de centre O et de rayon R et soit Ox une droite passant par O. Menons 
par un point M de C la tangente; elle coupe l’axe Oz selon un angle a. Si le point 
M est déplacé en M + dM, il parcourt sur C un élément d’arc ds = Rda et l’on 
a donc d 

8 


(6.17) 
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-Or 


Figure 6.8 : Courbure d’une courbe plane. (a) Dans le cas d’un cercle, on a la relation R=ds/da 
que l'on étend (b) au cas d’une courbe quelconque. 


(a) 


Pour une courbe plane quelconque, le rayon de courbure R sera défini de 
manière analogue, c’est-à-dire par le rayon du cercle osculateur à la courbe au point 
considéré. Pour une courbe plane représentée par une équation du type y = y(z) 
on aura 


121 3/2 
p- £ Etr] 


Z an ae (6.18) 


et pour une courbe définie paramétriquement par {x = x(t), y = y(t)}, on aura 
alors 


; .213/2 
d +? + 2 
da [cy — zy] 
Considérons maintenant une surface S de R3 représentée, au moins localement, 
par une équation du type z = f(E}, £?) : un point M de S est donc parfaitement 
défini par la donnée des deux coordonnées £! et £2. On peut toujours écrire, au 


voisinage d’un point [&), £3, zo = f (&, &)] de S 


ð ð 
z= zo + (& - 6) $ gee, + (- 6) Fa ines 
1 Of 
+ 5 (6-0) (E=) les + (6.20) 
expression qui se réduit à la suivante : 
1 oo 
z = z futt + Of), (6.21) 


si l’on prend soin de situer le point M à l’origine des coordonnées et de choisir 
le plan tangent en M parallèle au plan (£!,£2) (auquel cas on a E&i = 2 = 0 
et Of /OE*|g:9 = 0). Autrement dit, au voisinage du point (£5, £4) la surface S 
est approchée par le paraboloïde anisotrope (6.21). Dans l’expression (6.21), on a 
évidemment 
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gp ee) 

t “5 OËi.OËi be 3 
qui reflète l’anisotropie de S en M si fij # const. x 6;;. 
Plaçons-nous dans le plan tangent à S au point M et soit Ë une direction 
quelconque dans ce plan. Le plan défini par F'et l'axe des z [Fig. 6.9] est évidemment 
orthogonal à S en M; son intersection avec la surface S est une courbe C dont la 
courbure dépend, naturellement, de la direction £ choisie. Dans le plan tangent en 
M à S, la courbe C se projette selon £* = ta, où a est un paramètre quelconque, 

de sorte que dans le plan (Mz, Ë, elle a pour équation 


(6.22) 


1 ae 
z = zla) ~ zut t a’, (6.23) 
ce qui, pour sa courbure, donne immédiatement [cf. Eq. (6.19)] : 
K = fit’. (6.24) 


Figure 6.9 : Le vecteur arbitraire t, situé dans le plan tangent à la surface S au point M, définit avec 
l'axe Mz (normal à S) un plan orthogonal à S en M. Ce plan coupe S selon une courbe C, qui dépend 
de la direction € choisie, et dont la courbure est la courbure de S dans cette direction. 


Comme il se doit, K dépend de la direction considérée. Toutefois, une définition 
acceptable de la courbure de la surface S ne doit pas dépendre de E, même si l’on 
doit la relier aux courbures possibles des courbes intersections. Une telle définition 
ne peut donc dépendre que des invariants que l’on peut former à partir de la matrice 
|| fij||, c'est-à-dire de sa trace et de son déterminant. Si l’on appelle K; (i = 1,2) 
les valeurs propres ! de la matrice || f;;||, on aura 

Det. || fi;|| = K1.K2 = Ke (6.25) 


(courbure de Gauss) 


1 1 
3 À Ifill = 5 (1 + Ka) = Ku (6.26) 


(courbure moyenne). 


1. Rappelons que, par construction, ||f:;|| est une matrice symétrique : elle est donc diagonalisable. 
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Les deux valeurs propres K; et Ka sont les courbures principales de S, et les 
vecteurs propres correspondants (lorsque Kı # K2) sont les directions principales 
de S au point M. La courbure de Gauss ?, ou courbure intrinsèque de la surface, 
est la seule qui nous concernera réellement dans la gravitation relativiste car elle 
dépend de S en tant que telle et non en tant que surface plongée dans un espace 
plus grand (cette question est illustrée dans le prochain paragraphe); par contre, la 
courbure moyenne? dépend non seulement de S mais aussi de la manière dont elle 
est plongée dans R? et n’est donc pas intrinsèque. 

Pour s’en convaincre, considérons les cas d’une sphère de rayon R puis d’un 
cylindre d’axe Oz. Pour la sphère, on a 


z= VR -r = 
1 z? +y? 
~ R.¢1— = —— +... 
oie he 
et l’on a donc, en orientant la normale vers l’intérieur, 
1 
fij = R bij » (6.27) 
et, par conséquent, Kı = Kz = 1/R; soit 
1 1 
Ka = Ka Ss .2 
c= p MFR (6.28) 


Pour un cylindre, il suffit de considérer deux directions perpendiculaires et de 
trouver la courbure des courbes correspondantes : si l’on prend une génératrice et 
un cercle, on aura K, = 0 et Ky = 1/R, de sorte que 


Ke = 0 et Km = 1/2R. (6.29) 

Le cylindre est intrinsèquement plat — c’est ce que révélait la forme euclidienne 
(6.16) de sa métrique — tandis qu’en tant que surface plongée dans R3, il possède 
une courbure moyenne non nulle. 

Notons, au passage, le fait que la courbure moyenne dépend de I’ orientation 
choisie (dans R?) pour la normale à S : cela montre bien que Ky dépend non 
seulement de S mais aussi du plongement de S dans R°. Des définitions plus 
élaborées peuvent être trouvées dans B. Carter (1992). 

Nous avons souligné plus haut que la courbure 3 était liée à la métrique de la 
surface considérée. Vérifions-le maintenant. La métrique de R® 


ds? = 6;;dr dx  (i,5 = 1,2,3) (6.30) 


2. Notons que la courbure de Gauss est de dimension L~? tandis que la courbure moyenne est de 
dimension L~?. 

3. Dorénavant, nous ne nous intéresserons qu’à la courbure intrinsèque (de Gauss) et il n’y aura pas 
d’ambiguité lorsque nous parlerons de courbure. 
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jointe à l’équation locale de S 
3 — 1 inj , 
tzaz shit Ds (i = 1,2), (6.31) 


où l’on a choisi les zt comme coordonnées des points de S, donne immédiatement 
la métrique g;; de la surface 


Jij ~ Gi + fik- fut af. (6.32) 


Le premier terme 6;; est le terme euclidien; quant au second, il représente 
nécessairement une partie (non euclidienne) liée à la courbure, étant donnée sa 
dépendance en fij. L'expression de la métrique (6.32) montre également que la 
courbure — donc f;; — ne peut être obtenue à partir de g;; qu’en éliminant la 
dépendance dans les x, donc en dérivant deux fois : la courbure est bien liée aux 
dérivées secondes du tenseur métrique. 
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Afin de pénétrer le sens physique de la courbure de Gauss, nous allons 
considérer un exemple de variété à deux dimensions dû à H. Poincaré (1968). 
Soit donc une surface parfaitement plane — disons, pour fixer les idées, une table 
de marbre parfaitement polie, vérifiée au laser, etc. — et supposons que des êtres 
bidimensionnels y vivent, y fassent de la physique théorique et expérimentale. En 
particulier, ils disposent de règles graduées, toutes composées du même métal. Si 
la table de marbre est uniformément à la même température [Fig. 6.10] les règles 
de tous les expérimentateurs ont les mêmes propriétés, et ceux-ci mesureront les 
mêmes longueurs pour les côtés d’un triangle ABC, quel que soit le lieu où il est 
situé et quelle que soit son orientation [Fig. 6.10(a)]; de même ils vérifieront qu’en 
tout point le théorème de Pythagore est vrai et en concluront que l’espace à deux 
dimensions où ils évoluent est euclidien. Supposons maintenant que la température 
varie d’un lieu à l’autre et soit une fonction T(x, y) donnée. La longueur propre 
ds des règles des expérimentateurs bidimensionnels au voisinage de coordonnées 
(x, y) sera donnée par 
_ dr + dy? 
~ [L+xT(2,y)P ’ 


ou x est le coefficient de dilatation, supposé constant, de la régle, la table de marbre 
n’étant pas susceptible de se dilater ou de se contracter. Dans ces conditions, 
l’expérimentateur mesurant, par exemple, la somme des angles de son triangle 
rectangle ABC trouvera alors que celle-ci est différente de x et donc que son espace 
physique n’est pas euclidien. Il trouvera, de même, que sa courbure intrinsèque est 
donnée par 


ds? (6.33) 


K = XxVT, (6.34) 
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(a) (b) 


Figure 6.10 : La table de Poincaré. Lorsque le plan xOy est à température constante (a) les êtres 
bidimensionnels considèrent que leur espace est euclidien. Par contre (b), si la température n'est pas 
uniforme, les règles (i.e. les étalons de longueur) varient de point en point, le théorème de Pythagore 
n'est plus vérifié, et l’espace peut alors être considéré comme courbe. 


où l’on a négligé des termes d’ordre x”. Toutefois, par ses seules mesures, confinées 
à son espace physique, il ne peut avoir aucune information sur un éventuel espace 
euclidien R” dans lequel il serait plongé : cela reste pour lui un pur objet de 
spéculation théorique voire théologique. 


Quelles indications pouvons-nous encore tirer de cet exemple? Il est clair 
d’abord que la table de marbre n’est plate — sans courbure — que pour un observateur 
“extérieur”, à trois dimensions mais que, pour ses habitants à deux dimensions, elle 
apparaît intrinsèquement courbée. 

Cet exemple nous renseigne ensuite sur l'importance de la métrique ds?, 
directement liée aux mesures de longueurs possibles dans cet espace fictif et de 
ses liens physique avec la courbure : de manière imagée et un peu fausse (voir plus 
loin), on peut dire que cet espace est tel que les étalons de longueur y varient de 
point en point et ceci est caractéristique des espaces courbes. 

Enfin, nous pouvons mettre en évidence le lien et la différence entre coordonnées 
et distances : les distances, mesurées à l’aide de règles (i.e. d’étalons de longueur) 
sont évaluées à l’aide de la métrique ds?, tandis que les coordonnées ne servent 
qu’au repérage des points de l’espace [Fig. 6.11]. 


Surfaces dans R” — Espaces de Riemann 


Dans RS, une surface ordinaire peut être définie de plusieurs manières : 


z = z(x,y) (6.35) 
f(z,y,z) = 0 (6.36) 
T- =- 2 (61,67) 

y = y(ét,€?) (6.37) 


z = 2(67,6?) 
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sens des 
températures 
croissantes 


Figure 6.11 : Distances et coordonnées. Les points A et A’ d’une part, B et B’ d'autre part, ont même 
abscisse, xo et xı respectivement. Ces points sont disposés aux sommets d’un rectangle défini par des 
coordonnées (x,y) cartésiennes. Cependant, la distance AB est supérieure à la distance A'B', si les 
températures sont croissantes dans la direction des y : les règles se dilatent lorsqu'on les transporte de 


Yo en yı. 


et l'intersection de deux surfaces est, généralement, une variété de dimension 
inférieure, une courbe. Qu’en est-il dans le cas de R”? Comment ces notions 
usuelles se généralisentelles ? 

Afin de préserver la symétrie entre les diverses variables, nous ne considérerons 
que les définitions (6.36) et (6.37). Une hypersurface V;_ de R” est une variété 4 
(continuum) à n — 1 dimensions, que l’on peut donc définir analytiquement par 


foto) =O (6.38) 
ou par une représentation paramétrique (un plongement de V,,_, dans R”) 
x! (eae; va NS 
a? = x? (E1, E2,- E071) (6.39) 


ne a | 


La métrique définie sur une telle hypersurface est induite par celle de R”, 


8, 
I 


ds? = 6;; drt da , (6.40) 


et est donnée par 


i (el ¢2 .., gn-1 j (el ¢2 ... en- 
Ox? (E1, E2,- , E1) Ont (E1, E, E ') erag! (6.41) 


E AE ai 


gre dé” dé”, (6.42) 


Il 


4. Cf. Appendice D. 
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avec 


Ox? Oxi 


Jke = Ber ee bij (6.43) 


(k,l = 1,9,...,n—1:i,j = 1,2,...,n). 


Bien entendu, la représentation (6.38) permet également d’obtenir une forme 
du tenseur métrique ge sur l’hypersurface considérée, dès lors que l’une des 
coordonnées peut s’exprimer en fonction des n — 1 autres. 

De manière similaire, une variété à p dimensions, soit S,, plongée dans R”, 
sera déterminée soit par la donnée de n — p relations 


fi (est) = 0, fo (eee) = (0, + fr—p Ge, =0, 
entre les x’, soit paramétriquement par 


gi = x! (Eh En EP) 
x? = r? (€7,€7,--+, €?) (6.45) 


Le nombre de paramétres indépendants (de coordonnées indépendantes), ici p, 
qui définissent les points de S,, est la dimension de Sp. Soient maintenant Sp et 
Sq deux variétés de dimension p et q, respectivement. Lorsque leur intersection est 
non vide, on a, généralement, 


dim. [Sp N Sa] = pt+q-n. (6.46) 


De méme que précédemment, la métrique induite par R” sur S, est obtenue 
de manière analogue et l’on a encore la forme (6.43) avec, cependant, (k, £) = 
1,2,---p (au lieu de n — 1). 

Toutefois, nous nous intéresserons principalement à des variétés [Appendice D] 
an dimensions V,, (sans référence à un espace euclidien dans lequel elles seraient 
plongées), munies d’une métrique g;;[(7, j) = 1,2,---n] et à des sous-variétés Sp 
qui y sont plongées. Ce qui précède reste essentiellement valable sauf la relation 
(6.43) qui devient 


OER Age? 


où les {x°} représentent maintenant des coordonnées dans V,, et où les indices 
(k, £) varient de 1 à p. 


gkelSp] = 913 [Vn] (6.47) 
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Une variété (un “continuum”, selon l’expression de H. Poincaré) à n dimen- 
sions, munie d’une notion de distance — d’une métrique — définie par une forme 
quadratique s’appelle encore un espace de Riemann et joue un grand rôle dans les 
théories relativistes de la gravitation. Notons encore qu’une variété peut toujours 
être assimilée, localement, à son espace (“plan”) tangent : nous retrouverons cette 
propriété un peu plus loin et dans le chapitre 7 où elle permettra d’exprimer le 
principe d’équivalence. 


Courbure intrinséque d’une variété 


Nous avons vu ci-dessus que la courbure de Gauss d’une surface S à deux 
dimensions, de R3 a été définie comme propriété invariante liée à la courbure de 
courbes tracées sur 5. Nous nous sommes alors rendu compte que la courbure 
de S était directement proportionnelle aux dérivées secondes de la métrique de S 
(induite par celle de R3). 

La première remarque suggère que la courbure d’une variété V,, à n dimensions 
puisse être construite et définie à partir des courbures de surfaces à deux dimensions 
qui y sont plongées. Toutefois, la direction de ces surfaces (en un point) étant 
quelconque, la courbure elle-même va contenir un certain arbitraire qui se traduira 
par l’existence d’un tenseur, lequel exprimera toutes les possibilités d’orientation 
de surfaces à deux dimensions. 

Pour trouver ce tenseur, considérons en un point x de V, deux n—vecteurs 
quelconques a et b”. Formons la surface S engendrée par les géodésiques issues 
de x et tangentes au plan défini par les deux n—vecteurs a“ et b”. L'orientation de S, 
étant fixée par ces derniers, est donc arbitraire. La métrique de S, induite par celle de 
VA, est encore donnée par la relation (6.47), avec (k, £) = 1,2et(i,j) =1,2---n. 
La courbure de Gauss de cette surface est encore K = Det. ||fkell, où fre doit 
être trouvé à partir de l’expression (6.47) de la métrique gge de S, compte tenu de 
l’expression (6.32) qui permet de relier ces deux grandeurs. On trouve alors, après 
un calcul fastidieux, 

t mpn 
K= Hj CEE (6.48) 
(Jingjm — GimGjn) bi amb” 
qui indique clairement la dépendance de K des vecteurs a” et b”, et donc de S. 
Dans cette dernière relation, le tenseur Rijmn, le tenseur de Riemann, est donné 
par 


1 
Rijmn — 2 {On im a OniGjm = Oj Gin =k OimGjn} 
+ Jrs lek = lle) ’ (6.49) 


où tous les indices varient de 1 à n. Dans l’équation (6.48), c’est la seule partie qui 
a la fois soit indépendante de S et dépende linéairement des dérivées secondes de 
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la métrique de V,,. Elle représente nécessairement la courbure de V,, : le tenseur de 
Riemann est le tenseur de courbure. 

A ce point de l’étude de la courbure d’une variété à n dimensions, il convient de 
remarquer que l’on a parlé de vecteurs, tenseurs, etc., sur Vp sans que ceux-ci aient 
été réellement définis, nous reposant sur les considérations du chapitre 3 concernant 
les coordonnées curvilignes et qui, pour la plupart, restent valables dans un espace 
courbe. Nous y reviendrons un peu plus loin dans ce chapitre. 

Revenons à la relation (6.49) définissant le tenseur de courbure Rijmn. Ce tenseur 
apparaît également lorsqu’on essaye de transporter un n-vecteur parallèlement à 
lui-même le long d’un circuit fermé : si A* est un tel vecteur, il est facile de montrer 
que sa variation 6 A’, après un tour, est donnée par 


A ls: . 
BAS = SR jmn A) f z" du", (6.50) 


expression utilisée dans la plupart des ouvrages de relativité pour introduire le 
tenseur de courbure. Ainsi, une condition nécessaire et suffisante pour que 6At = 0, 
quel que soit le circuit fermé considéré, est que le tenseur de Riemann soit nul; 
autrement dit, 6A* = 0 si et seulement si l’espace est plat, localement. 

Le tenseur R;;mn apparaît aussi dans toutes sortes de propriétés où la courbure 
intervient, et qui peuvent également être utilisées pour l’introduire. Ainsi l’équation 
de la déviation géodésique [Chap. 7] 


= R ju 6x D (6.51) 


(où 62* est la déviation entre deux géodésiques) permet, elle aussi, l'introduction 
de ce tenseur. Cela est a priori un peu étonnant car on pourrait s'attendre que 
des manifestations très diverses de la courbure introduisent des tenseurs différents 
construits à partir de g;; et de ses premières dérivées. Le fait que R;;4 apparaisse 
toujours laisse présumer de l’unicité de ce tenseur; ce qui nous amène à la seconde 
remarque effectuée au tout début de ce chapitre. 

Si nous avions, en effet, essayé de définir la courbure à l’aide, entre autres, des 
dérivées secondes 0;;gke du tenseur métrique de V,,, nous nous serions de suite 
heurtés au fait qu’elles ne constituent pas un tenseur. Cependant, en construisant 
le tenseur le plus général possible, linéaire en les dérivées secondes du tenseur 
métrique, nous aurions immanquablement abouti au tenseur de Riemann : 

Théorème : Le tenseur d'ordre 4 le plus général, linéaire en les dérivées 
secondes du tenseur métrique, est le tenseur de Riemann. 

[Démonstration : voir, par exemple, S. Weinberg (1972)]. 

Dans ces conditions, il n’y a plus rien d’étonnant à ce que le tenseur Rijki 
apparaisse partout où la courbure se manifeste. 
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Propriétés du tenseur de courbure 


Le tenseur de Riemann (6.49) posséde un certain nombre de propriétés 
algébriques qui découlent de sa forme explicite. Ainsi, en élevant le premier indice 
à l’aide du tenseur métrique, il est aisé de montrer que l’on a également la relation 


Rô jke = Okie — Oly + GM ee — TUT Te - (6.52) 


De même, on voit immédiatement que R;,44 obéit aux deux relations de symétrie 
suivantes : 


Rijke = Ryeij = Ryier (6.53) 


Rijke = —Rjike = —Rijer (6.54) 


ainsi qu’à la relation cyclique 


Rijke + Rijk + Rikgj = 0. (6.55) 


Ces trois dernières relations permettent d’obtenir le nombre de composantes 
indépendantes du tenseur de courbure. Les indices (i, j, k, £) variant de 1 à n, une 
paire d’indices — soit les deux premiers, soit les deux derniers — de R;;xe ayant la 
propriété (6.54) peut prendre A = $n(n — 1) valeurs; comme, d’autre part, les 
couples (i, j) et (k, €) sont symétriques, [Eq. (6.53)], ils peuvent prendre 3A(A+ 1) 
valeurs, c’est-à-dire 


1 In(n—1) [1 
= n(n 1) (n? -n +2) = Bn; (6.56) 


enfin, la relation cyclique (6.55) impose C4 contraintes, de sorte que le nombre de 
composantes indépendantes cherchées est 


1 
Tn = Bn- c$ = ge (n’ —1), (6.57) 


ce qui montre bien que sin = 2, Rijke ne possède qu’une seule composante 
indépendante : une surface de R3 ne possède qu’une seule courbure intrinsèque. 
Ceci n’est vrai ni pour n = 3 qui implique 6 composantes indépendantes, ni 
pour n = 4- le cas auquel nous nous limiterons désormais Ÿ — qui entraîne 20 


5. Les indices grecs prendront, comme auparavant, les valeurs 0, 1, 2, 3. Ainsi, Ryvap sera le tenseur 
de courbure d’une variété à 4 dimensions. 
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composantes indépendantes. Pour n = 1, on obtient le résultat a priori un peu 
surprenant qu’une courbe n’est pas ... courbée! Il faut se rappeler, cependant, que 
le tenseur de Riemann ne caractérise que la courbure intrinsèque : si une courbe est 
intrinsèquement plate elle est, par contre, courbée extrinsèquement, c’est-à-dire 
en tant que variété plongée dans R” (n > 1). 

Aux propriétés (6.53}-(6.55) du tenseur de Riemann, il faut adjoindre l’identité 


Vi Ryvap + Ve Rywra + VaRuvex = 0, (6.58) 


P identité de Bianchi. 
A partir du tenseur de courbure, on peut former plusieurs tenseurs utiles, tel le 
tenseur de Ricci, 


Ruv = Rò HAV (6.59) 


qui est symétrique en vertu de (6.53). A l’aide de la propriété d’antisymétrie 
(6.54) de Rs, on montre facilement que le tenseur de Ricci est le seul tenseur 
d’ ordre 2 que l’on puisse former par contraction du tenseur de Riemann : les autres 
contractions possibles donnent 0 ou +R». En outre, le scalaire 


R = RE = R® ag, (6.60) 


le scalaire de courbure, est le seul scalaire non nul que l’on puisse former © à partir 
de Ryvop- 


Enfin, les identités de Bianchi (6.58) contractées sur les premier et dernier indices 
d’une part, ainsi que sur les second et troisième, d’ autre part, fournissent la relation 


VaR — 2VQRS = 0 (6.61) 


où nous avons utilisé les définitions (6.59) et (6.60) ainsi que les propriétés (6.53)- 
(6.55) du tenseur de courbure. Cette dernière relation s’écrit encore 


1 
Va LR — Td =0. (6.62) 
Le tenseur 
1 
Gu = Rw — 5 Ik (6.63) 


est le tenseur d’ Einstein, qui jouera un rôle essentiel dans la suite [Chap. 8]. 

Les définitions adoptées dans le cas de l’espace-temps — dont la métrique est 
pseudo-euclidienne — sont étroitement calquées sur le cas des variétés Vņ„ à métrique 
définie positive. L’espace-temps sera donc (localement) pseudo—euclidien si et 


1 
Ig 


6. La relation (6.55) permet de montrer que le pseudo-scalaire pete OP Ry vas est nul (g est le 


déterminant de guv). 
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seulement si R,,48 = 0. A cet égard, notons que les conditions R = 0 ou Ry, = 0, 
voire G = 0, représentent des conditions nécessaires mais non suffisantes pour 
que l’espace-temps soit (localement) plat. 


L’espace-temps comme variété riemannienne 


Lorsque nous effectuons des expériences de laboratoire, l’espace-temps nous 
paraît être celui de Minkowski, c’est-à-dire un espace plat, au moins à notre 
échelle. Autrement dit, même si l’espace-temps est courbe, il nous apparaît être 
localement plat, pourvu que nous ne considérions que des événements très voisins 
entre eux. Cela signifie encore que la variété (courbe) espace-temps est (localement) 
assimilable à son espace (4—plan) tangent. Une telle structure de variété [assimilable 
localement à un espace (pseudo-) euclidien] munie d’une métrique (qui se réduit, 
dans un système de coordonnées convenable, à 7,,) constitue, par définition, 
une variété riemannienne [Appendice D]. Nous verrons, au cours du chapitre 7, 
comment le principe d'équivalence est relié à cette intuition; pour le moment 
nous essaierons d’établir un lien purement algébrique avec ce qui précède. En 
particulier, nous allons vérifier que, localement, on peut toujours trouver un système 
de coordonnées dans lequel (i) le tenseur métrique g,,, se réduit à la forme (pseudo-) 
euclidienne 7,,,, et (ii) les dérivées premières du tenseur métrique sont nulles. 


Considérons donc un changement de variables — de coordonnées — du type 


{at}e {2%} où = (x) (6.64) 
avec 
i. a OEE) 
AP u = Ta + (6.65) 


Le tenseur métrique se transforme alors comme [Chap. 3] 


arte) = AP p A v gu CE à (6.66) 
Plaçons-nous maintenant en un point M de coordonnées an et considérons un 
r s 4 Dette P 
point de coordonnées xò proche de M de sorte que nous puissions développer 
aussi bien les A” ,,, que les g,,, en série de Taylor : 


AM (al) = AM + (a ag) Aw 
+ 5 (2 -20 ) (67-28) eg +: (6.67) 


i 


, , Oa" 
H A = mÀ 
At (2 zà) ðr Ax’ 
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1 A V a’ a! xt 
ta (« -à ) (« a3) Ozh’ rN ðr” (6.68) 


.1 (> 7 7) (x af) ue. Li (6.69) 


où les grandeurs A” w, guv et leurs dérivées, dans les membres de droite de 
ces deux dernières équations, sont prises au point M. Insérant maintenant les 
développements (6.67) et (6.68) dans la loi de tranformation (6.66) pour le tenseur 
métrique, il vient 


guv (2’) = AM pl A, Guu + 
+ (x" _ x’) { A# wA” w ONG}, 
o?r” 
Ox"'Ox" 
y 0? ah 


+A” pt Ope 


Ox! Aa! 


+ 5 (2 = 28) (2 28) Furor + (6.70) 


Note 


Examinons maintenant les possiblités de choix des changements de coordonnées 
(6.64) (6.65). La matrice A” ,,, possède 16 éléments totalement arbitraires tandis 


que les dérivées 872” /Ox”’.Ox*’ comportent 4 x Fac + | — 40 coefficients, 


arbitraires eux aussi. Enfin dans l'expression [---},1., non écrite parce que 
complexe et inutile, sont implicitement contenues des dérivées d’ordre 3, du type 
Pat /Ox"" 0x" Ox’. Ces dernières, compte tenu de la symétrie entre les indices 
(u’, \’,0’), sont au nombre de 80 (80 = 4 x 20). Par un choix convenable des 
16 A4 „ nous pouvons certainement choisir les 10 composantes de guu de sorte 
que uv! = Nyt : les 6 degrés de liberté qui subsistent correspondent alors aux 
6 degrés de liberté des transformations de Lorentz dans l’espace tangent (3 pour 
la vitesse v et 3 pour une rotation spatiale). De même, les 40 dérivées 0, apr 
peuvent être annulées exactement grâce à la possibilité de choisir exactement les 40 
coefficients 0x" / Ox Ax°"'. Par contre, nous ne pouvons pas, en général, annuler 
les 100 dérivées secondes pu garg’ Car nous ne disposons que de 80 degrés de 
liberté Ox" /01” x?’ Ox. Aussi subsiste-t-il 20 degrés de liberté qui concernent 
les dérivées secondes du tenseur métrique : ils correspondent précisément aux 20 
composantes indépendantes du tenseur de courbure R,,48. On appelle quelquefois 
ces propriétés le théorème de platitude locale, ce qui se traduit analytiquement par 
l'existence de coordonnées locales telles que : 
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gwu = Mu + O (x°) . (6.71) 


En conclusion, on peut toujours trouver un système de coordonnées local où 
le tenseur métrique prend la forme (pseudo-) euclidienne (6.71) et dans lequel les 
symboles de connexion I B s’annulent en un point. Lorsque le tenseur de courbure 
est identiquement nul, ce qui est le cas de l’espace de Minkowski, on peut trouver des 
coordonnées globales, et non plus seulement en un point, pour lesquelles guv = ur 
et r$ g = 0. Nous reviendrons au chapitre 7 sur la signification physique de ces 
propriétés. 


Quelques propriétés des tenseurs dans un espace courbe 


La plupart des définitions et propriétés des tenseurs de l’espace de Minkowski en 
coordonnées curvilignes, étudiées au chapitre 3, restent valables en espace courbe 
avec quelques petites modifications qu’il convient d’avoir à l’esprit. 

Considérons un 4-vecteur A’ de la variété espace-temps, défini ainsi qu’au 
chapitre 3. Sa dérivée covariante est ? 


Vad! = ða At + TE, A, (6.72) 


et ses dérivées covariantes secondes sont données par 


Va Ve Al = ðapA” + ITEA” + (6.73) 


de sorte qu’en échangeant les indices a et 8 et en soustrayant, il vient 


(VaYs — VaVo) A" = R" vag A”; (6.74) 


autrement dit, dans un espace courbe les dérivées covariantes ne commutent pas. 
Dans l’espace de Minkowski, on avait [V,, Vg] = 0 dans tous les systèmes de 
coordonnées curvilignes. La courbure introduit donc dans l'algèbre tensorielle 
quelques différences importantes. Notons que la relation (6.74) aurait pu également 
être utilisée pour définir le tenseur de courbure. 

Donnons maintenant, sans démonstration [voir exercices], quelques relations 
utiles, valables aussi bien en espace courbe qu’en espace plat; on a: 


T” w = O In yg] (6.75) 


V,AH = a (ar visi) (6.76) 


7. La relation (6.72), jointe aux propriétés énoncées au paragraphe précédent, montre qu’il existe 
toujours un système de coordonnées locales tel que V a A" =O, A". 
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f Vislatev, a" = | dE, A” (6.77) 
Vv OV 


(théorème de Gauss) 


1 
dÈ, = 3 VIgleuves dx” A dx® À dz? (6.78) 


V, AMY = a, (vigia) aE (6.79) 


si 
vial 


1 
Vu A = ——8, (VIA 6.80 
a (Vigia“) (6.80) 


(A#” antisymétrique) 


Trois arguments en faveur d’un espace-temps courbe 


Quoique la véritable question devrait être : “Pourquoi l’espace-temps serait-il 
plat?”, notre intuition repose avant tout sur la simplicité des notions euclidiennes; 
aussi nous faut-il plutôt argumenter en sens inverse. En fait, nous sommes assez 
naturellement conduits à concevoir que notre espace—temps est courbe, même si rien 
ne l’impose véritablement : une expérience n’ impose jamais un concept théorique, 
même si elle le suggère plus ou moins. 

1. La relation E = mc?, en associant une masse à toute forme d'énergie 
(et cela reste à vérifier expérimentalement; voir le chapitre 7), jointe à l’égalité 
expérimentale entre masse inerte et masse grave (principe d'équivalence faible), 
implique que, désormais, tout pèse ! Il n’existe pas de forme de matière qui soit gravi- 
tationnellement neutre. Il en résulte que, même en l’absence de forces d’interaction, 
les corps sont constamment accélérés et la notion même de mouvement inertiel 
devient dénuée de sens, sinon peut-être sur de courtes distances et pendant de 
petits intervalles de temps, c’est-à-dire localement. 

Ainsi l’espace-temps devient, en présence de la gravitation, localement 
(pseudo-) euclidien, localement minkowskien. Il ne possède plus un système de 
droites du genre temps, auxquelles étaient associés des systèmes d’inertie globaux 
via des mouvements inertiels, globaux eux aussi. L’espace-temps apparaît ainsi 
comme un espace (pseudo-) riemannien. Le mouvement Je plus “droit” possible, 
c’est-à-dire un mouvement “géodésique”, dépend alors de la répartition et du 
mouvement des sources d’énergie dans l’espace-temps par l'intermédiaire de la 
loi d’ attraction universelle ou, plus généralement, d’une loi covariante traduisant 
l’existence d’interactions gravitationnelles. Ce type de mouvement ne peut jamais 
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être réduit à un mouvement rectiligne et uniforme, dans tout l’espace-temps, grace 
à un choix judicieux de système de coordonnées : l’espace-temps est courbe. 

2. Un argument de nature différente, dû à A. Schild (1967), repose sur le décalage 
vers le rouge d’un photon “grimpant” dans un champ de gravitation, décalage 
mesuré, rappelons-le, par R.V. Pound et G.A. Rebka (1960) ainsi que par R.V. 
Pound et J.L. Snider (1965), et observé dans le cas de Sirius B par W.S. Adams 
(1925), observations confirmées plus tard dans d’autres naines blanches par J.L. 
Greenstein, J.B Oke et H.L. Shipman (1971) (1985). 

Rappelons [Chap. 4] que si un observateur situé à altitude zo envoie des signaux 
(des photons) de période To, un observateur situé à l’altitude z [Fig. 6.12] reçoit ces 
mêmes signaux avec une période T > To, bien que ces deux observateurs soient 
au repos l’un par rapport à l’autre : dans l’espace de Minkowski, tous les rayons 
lumineux émis par l observateur situé en zp sont “parallèles” entre eux et devraient 
donc arriver en z espacés de T = To. Cette contradiction montre que l’espace de 
Minkowski est inadéquat en vue de la description des phénomènes gravitationnels 
et seul un espace courbe peut lever la contradiction. On exprime quelquefois ce fait 
en disant que, dans un espace courbe, les étalons de distance (et aussi de temps) 
varient de point en point, en raison de la gravitation. Cette manière de dire, quoique 
imagée, n’est pas réellement correcte. En effet, une horloge atomique donnée, située 
à l’altitude 29, possède exactement la même période qu’une horloge identique 
placée à l’altitude z1. C’est seulement lorsqu’on compare les indications fournies 
par les deux horloges, par exemple à l’aide de signaux électromagnétiques, que l’on 
constate une différence. Cette différence — certes due à la courbure de l’espace- 
temps — n’a évidemment pas pour cause une modification réelle des étalons de 
temps en présence d’un champ de gravitation [c’est-à-dire une modification du 
comportement d’horloges (non gravitationnelles, tel un pendule simple)], mais 
prend sa source dans la connexion établie entre deux points distincts de l’espace- 
temps : cela apparaîtra plus clairement au chapitre 7 (décalage spectral vers le 
rouge). Dans l’expérience de Pound et Rebka, la présence de gravitation fait que la 
comparaison des étalons de temps donne des résultats différents à l’altitude Zo et à 
l'altitude z. 

Il est intéressant de noter que, dans cette discussion de Schild, la nature même 
du champ de gravitation n'intervient nulle part : il peut s’agir d’un champ scalaire, 
spinoriel, vectoriel, etc. Le champ de gravitation induit une courbure de l’espace- 
temps sans que la nature de cette courbure soit autrement spécifiée. 

3. La courbure des rayons lumineux, observée au voisinage du Soleil et bientôt 
au voisinage de Jupiter, vérifiée à l’aide des “mirages gravitationnels” [Chap. 7], 
rend, elle aussi, nécessaire l’introduction d’un espace-temps courbe. En effet, la 
structure de l’espace de Minkowski est essentiellement déterminée ® par le cône de 
lumière, le même partout : c’est le cône de lumière qui induit la structure métrique 
de l’espace de Minkowski, structure définie par le tenseur 7,,. La courbure des 


8. C’est pourquoi nous avons beaucoup insisté, au chapitre 2, sur les propriétés de l’espace de 
Minkowski, liées au cône de lumière. 
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(b) 


Figure 6.12 : Diagramme d’espace-temps (dans l’espace de Minkowski) correspondant à 
l'expérience de Pound et Rebka (1960). En (a), les signaux émis par un observateur situé à l’altitude 
zo au-dessus du niveau de la mer, se propageant à la vitesse de la lumière, c'est-à-dire le long de 
génératrices de cônes de lumière, avec la période To, sont reçus par un observateur, situé à l'altitude 
z, avec la même période : ceci est contraire à l'expérience de Pound et Rebka, qui montre que T>To. 
L'espace de Minkowski est incompatible avec l'expérience. En (b), on tient compte de la courbure des 
rayons lumineux dans le champ de gravitation terrestre : l'argument reste encore valable. Pour expli- 
quer l'expérience de Pound et Rebka, il est nécessaire que l'étalon de temps en zo soit différent de celui 
à l'altitude z, donc que l’espace-temps soit courbe. 


rayons lumineux au voisinage du Soleil indique que le cône de lumière est déformé 
par la gravitation et ce, de manière différente selon que l’on est plus ou moins 
proche de la surface. Comme c’est précisément le cône de lumière qui permet 
d’obtenir la métrique de l’espace-temps, on en déduit nécessairement que celle-ci 
varie spatialement. Par contre l’argument de Schild, rappelé ci-dessus, montrait 
que l’étalon de temps (une “horloge”) variait avec la gravitation. Ainsi ces deux 
faits expérimentaux permettent d’estimer que la gravitation fait varier les étalons 
de temps et de distance : l’espace-temps apparaîtra donc courbe. 

Ajoutons que la lumière constituant notre étalon de “rectitude”, celle-ci perd 
donc toute signification en tant que tel dès lors que la gravitation est présente : 
les droites de l’espace de Minkowski, y compris isotropes, n’ont plus aucun sens 
physique général, ce ne sont plus des objets géométriques intrinsèques à la structure 
de l’espace-temps. 


EXERCICES 


1. On considère l’espace à deux dimensions constitué par la “table de Poincaré” que l’on chauffe, 
la propagation de la chaleur étant déterminée par la relation 


WT=S, 
ot S est la source de chaleur. La métrique est toujours donnée par 
2 dr?+dy? 
ds* = GFT . 
On suppose maintenant que S possède la symétrie circulaire ainsi que T°. 


(i) Calculer T(r) lorsque S=const. 


Exercices 153 


Gi) Calculer alors la courbure K de cet espace et montrer que la métrique peut encore s’écrire sous 
la forme 


ds? = dr+r2402 
s = Kpy’ 
(14+ fr?) 


où F et 6 s'expriment (préciser comment) en fonction de x et y. 
(iii) Lorsque K est négatif, montrer que la métrique peut encore s’écrire comme 


ds? = |K|'/? [dx + sh?xd0?] . 
(Réf. : H.P. Robertson et T.W. Noonan (1968)] 


2. Dans l’espace R4 on considère Ja surface S3 définie par 


w =a cos x 
z =a sin x cos 8 

y =a sin x sin 0 sin @ 
xz =a sin x sin 0 cos g. 


(i) Trouver la métrique de S3 dans le système de coordonnées {x,0,w}. 
(ii) Trouver les symboles de Christoffel et en déduire les composantes du tenseur de courbure. 


3. Soient Sp et S, deux surfaces à p et q dimensions, respectivement, plongées dans R”. Montrer 
qu’en général, dim[S,NS,]=p+q—n. 


4. On considère une variété riemanienne à deux dimensions munie de la (pseudo-) métrique 
ds? = a? [1-ch?e0, sin? é'] dé? — a?sh?€°dé!? 
où (€°,€+) sont des coordonnées curvilignes sur la variété et où a est une constante ayant les dimensions 
d’une longueur. 


(i) Donner les composantes gi; du tenseur métrique et calculer directement les symboles de 
Christoffel T£.. 


Gi) Ecrire l’équation des géodésiques à partir de la définition 
6 f ds=0, 


et en déduire les symboles de Christoffel par identification avec l'équation des géodésiques (3.142). 
(iit) Calculer le tenseur de courbure. La variété est-elle courbe ? 
(iv) On effectue le changement de coordonnées {¢}— {£} défini par 


gr =ach g? 
¿'! =ash€® cos £!. 
f _ (a) Calculer les coefficients des transformations directe et inverse, c’est-à-dire les tenseurs 
agt (AE) et 8E /OE. 
(b) Calculer la nouvelle forme du tenseur métrique de deux manières différentes. 
(c) Calculer les nouveaux symboles de Christoffel de trois maniéres différentes. 
(v) Caculer l’élément de volume 4/|gldé!dé?. 
5. Montrer que 


G) Th, = 26 Inlg|. 
PH aBpe anà Ap 
GD greg = Fe Où [o> Visi]. 
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(iii) Vp FA = x ou | lr” ]. 


GV) VA” = Se [Visi A*]. 


6. Vérifier que (Vp Vi -V Vy)Aa = —R* uva Ah: 


7. Montrer que si u” up, = +1, alors u” V aup =0. 


8. Soit T”” un tenseur. Montrer que 


(Va Vo VoVy)TO = R® yyy TS 4+ Ro juu TA. 


9. Soit ¢ un champ scalaire. Calculer (Va Vs — VaVa)¢. 
10. On considère un espace-temps à quatre dimensions dont la métrique est donnée par 
ds? = A(r)dt? — B(r)dr? — r?d8? — r? sin? Ody? . 
Trouver l’équation des géodésiques et les symboles de Christoffel. 
11. Soit S? la sphère usuelle de R?, décrite par des coordonnées polaires. 
(i) Rappeler quel est son tenseur métrique g:; et les symboles de connexions re. 
(ii) Trouver les tenseurs de courbure et de Ricci. Trouver le scalaire de courbure. 


12. Mêmes questions pour la sphère S? plongée dans R4. 


13. Mêmes questions pour lhyperboloïde H? plongé dans M“ et d’équation 2°” — x?=a? (a = 
const.). 


CHAPITRE 7 


Le principe d’équivalence 


L'expérience de pensée (“Gedankenexperiment”) que constitue l’ascenseur 
d'Einstein, étudiée au chapitre 1, indique que, dans un champ de gravitation 
homogène et uniforme, il est toujours possible d’annuler celui-ci, à l’aide d’un 
choix judicieux de coordonnées. Il est clair, d’autre part, que dans le cas d’un champ 
de gravitation qui n’est ni homogène ni uniforme, il existe toujours une échelle de 
temps et de distance telle qu’il possède approximativement ces propriétés. Il est 
alors possible d’annuler localement, dans l’espace et dans le temps (c’est-à-dire 
sur des distances très faibles et pendant des intervalles de temps très courts), les 
effets mécaniques de la gravitation. On se souvient [Chap. 1} que cette possibilité 
était liée à l’égalité supposée de la masse inerte et de la masse grave d’un corps, 


Minertie = Merave 5 (7.1) 


égalité théorique suggérée par une égalité expérimentale vérifiée avec une excellente 
précision (voir plus loin). L'égalité (7.1), le postulat (7.1), s’appelle le principe 
d'équivalence faible. 

Ce principe est ensuite étendu non plus aux seuls effets mécaniques dus à la 
gravitation, mais encore aux effets de toutes les lois de la physique, qu’il s’agisse de 
l’électromagnétisme ou des phénomènes quantiques. Ainsi cette extension, appelée 
le principe d'équivalence fort, affirme, par exemple, que dans un référentiel en chute 
libre, la lumière se propage en ligne droite, que les équations de l’électromagnétisme 
sont les équations de Maxwell ordinaires, etc. Une extension supplémentaire, le 
principe d'équivalence ultra-fort, affirme la validité du principe en ce qui concerne 
la gravitation elle-même. 

Le principe d’équivalence ! entraîne une révision fondamentale de nos concepts 
d'espace et de temps. En effet, dire que, localement, les lois de la physique sont 
les lois usuelles (donc relativistes), c’est aussi affirmer que, localement, l’espace- 
temps est l’espace de Minkowski. C’est également admettre qu’en chaque point de 


1. Sauf mention explicite du contraire, lorsque nous utiliserons l’expression “principe d'équivalence”, 
il s’agira toujours du principe ultra-fort. 
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l’espace-temps, on peut toujours trouver un système de coordonnées lorentziennes, 
lesquelles correspondent donc à un système de référence “en chute libre”. Une 
exigence de cohérence minimale est alors que l’on puisse raccorder ensemble tous 
ces systèmes de coordonnées locales. Tout ceci est, en fin de compte, caractéristique 
d’une variété pseudo-riemannienne [V*, g,,,(x)], à quatre dimensions, munie 
d’une (pseudo-) métrique gy [Appendice D], caractéristique de la manière dont 
la gravitation agit sur les étalons de temps et de longueur, et donc sur l’ensemble 
des phénomènes physiques. 

Toutefois, si le principe d’équivalence nous apprend que l’espace-temps est 
une variété pseudo-riemannienne, et donc a priori un espace-temps courbe, il 
ne nous enseigne rien sur la façon dont il est courbé, c’est-à-dire sur le tenseur 
métrique g,,,(x). C’est pourquoi ce principe permet une grande variété de théories 
relativistes de la gravitation dont nous n’examinerons qu’une seule, au chapitre 
suivant, la Relativité Générale. 

Dans ce chapitre, nous explorerons davantage les conséquences du principe 
d'équivalence et ses fondements expérimentaux. 


Le principe d’équivalence faible 
et les expériences d’E6tvés-Dicke 


Nous avons déjà expliqué que les expériences de Galilée sur la chute des corps 
constituaient la première indication suggérant l’identité des masses grave et inerte. 
L'existence de ces deux types de masse avait d’ailleurs bien été comprise par 
Newton qui, à l’aide d’un pendule simple [Chap. 1], avait montré leur égalité à 
environ un millième près. Toutefois, à la fin du siècle dernier, la nécessité d’une 
meilleure précision se faisait sentir et était d’ailleurs rendue possible par les progrès 
techniques de l’époque. 

Le principe de cette mesure [c’est-à-dire, de l'égalité Min. = Mgr.] est simple; 
il consiste à se placer dans une situation physique où les deux types de masse 
interviennent concurremment pour donner lieu à une situation d’équilibre de 
l'appareil expérimental. Ainsi la masse inerte sera liée à une force du type centrifuge 
{rotation de la Terre) tandis que la masse grave contribuera de par la force de 
pesanteur. 

1. L'expérience de R. Eötvös est l’une de ces expériences (1889); répétée à 
plusieurs reprises avec divers perfectionnements avec D. Pekár et E. Fekete (1922), 
elle avait beaucoup impressionné Einstein. Son principe est le suivant. Considérons 
[Fig. 7.1] le système constitué par un pendule de torsion dont l'équipage mobile 
est formé par deux masses A et B, faites de substances différentes, et situées à des 
distances £4 et £g du fil de torsion. Supposons que les deux corps A et B réagissent 
différemment au champ de gravitation ambiant (celui de la Terre, en l’ occurrence). 
Cela signifie que le rapport des masses graves aux masses inertes de ces deux corps 
n’est pas une constante universelle (que l’on peut toujours poser comme étant égale 
à 1 par un choix judicieux des unités de masse). Dans ces conditions, la position 


Le principe d’équivalence faible et les expériences d’Eôtvôs-Dicke 157 


Figure 7.1 : Schéma de principe des expériences d’Eôtvüs-Dicke. 


d'équilibre du pendule va varier légèrement par rapport à celle qu’il aurait si les 
deux corps À et B réagissaient de manière identique. 


Examinons cela d’un peu plus près et, à cette fin, détaillons davantage les forces 
auxquelles est soumis le pendule [Fig. 7.2]. Une masse quelconque est soumise 
d’une part à la pesanteur P = mg dirigée verticalement et, d’autre part, à une force 
horizontale Fy = mw? R sin y, où g est l'accélération de la pesanteur, w la vitesse 
de rotation, R le rayon de la Terre et ọ la latitude du lieu où se situe l’expérience 
(en l'occurrence, la latitude de Budapest). Les forces horizontales [Fig. 7.3] qui 
agissent sur le pendule sont équilibrées par la torsion du fil et l’on a alors 


C = La Fa — Le Fun (7.2) 


centrifuge 
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Figure 7.2 : Les forces qui agissent sur une masse située à la surface de la Terre. 
où C est le couple des forces. A l équilibre, les forces verticales obéissent à 


la (Mgag — MAGv) = B+ (Mang — MiBGy) (7.3) 
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Mea & yer 
Á | 
MgB & 


Figure 7.3 : Action des différentes forces sur Péquipage mobile du pendule. 
où Gy est la composante verticale de l'accélération centrifuge 
Gy =w?R cos y. (7.4) 


Les relations (7.2) et (7.3) donnent encore 


-1 
c= tama {1 ~ [ts a] [Z2 s- 6v] | , (7.5) 
j MiA MiB 


qui, compte tenu de ce que Gy < g, s’écrit également 


(7.6) 


C= tamga Gu {TA _ me) | 


MgA MgB 


où la composante horizontale Gy de l'accélération centrifuge est donnée par 


Gy = w?R sin g. (7.7) 


La relation (7.6) indique clairement que si le rapport de la masse inerte à la masse 
grave n’est pas une constante universelle (autrement dit, sim; # Mg, avec un choix 
convenable d’unités, et ce pour toute substance), alors une rotation du pendule est 
possible (C 0), laquelle pourrait être observée. 

D'un point de vue expérimental, l’expérience est réalisée deux fois, en échan- 
geant le rôle des masses À et B. Cela permet, d’une part, d’obtenir une position de 
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référence pour l’équipage mobile du pendule et, d’autre part, de pouvoir mesurer 
une déviation éventuelle plus importante — le double — de ce même équipage. 

L'appareil de R. Eötvös est représenté sur la figure 7.4. La forme curieuse de 
l'instrument est due (R.H. Dicke (1961)] à ce qu’il était conçu et utilisé en vue de 
recherches géophysiques ?. Le décalage en altitude des deux masses du pendule était 
alors rendu nécessaire pour mesurer des gradients verticaux du champ de gravitation 
terrestre. Malheureusement, cette même structure est, dans le cadre de la vérification 
du principe d’équivalence faible, une source d'erreurs peu contrôlables; elle rend, en 
effet, l’appareil sensible aux gradients du champ de gravitation et donc à la position 
même des objets massifs — telle celle de l’expérimentateur — autour de l’appareil. 
L'expérience fut réalisée d’abord en 1889 par R. Eötvös puis en collaboration avec 
D. Pekár et E. Fekete en 1922, en utilisant des substances diverses (cuivre, verre, 
etc.) et aucune déviation sensible ne fut trouvée. Le résultat final (1922) est 


ajustement vertical 


espace isolant 


fil de suspension 


Figure 7.4 : Schéma de Pappareil d’Eôtvôs [extrait de Annalen der Physik, 68, 11, 1922; article de 
R. Eötvös, D. Pekar, E. Fekete; reproduit avec l'aimable autorisation de l'éditeur]. 


R.H. Dicke (1961, 1965) a émis les critiques suivantes sur cette expérience 
[voir aussi F. Everitt (1975)] : (i) sa sensibilité éventuelle aux gradients du champ 
de gravitation; (ii) la possibilité de courants de convection apparaissant du fait 
de l’existence de gradients de température (même non mesurables!) au sein de 
l'appareil; (iii) la contamination magnétique des poids : quelques 10 $g d’un 


2. Un domaine où R. Eötvös a laissé un nom... 
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matériau magnétique suffisent, en raison du champ magnétique terrestre, à produire 
une déviation du pendule environ 1000 fois plus importante que l’erreur probable 
annoncée par R. Eötvös; (iv) la diffraction du télescope, servant à la lecture de 
la déviation du miroir lié à l’équipage mobile du pendule, est une source d’erreur 
supplémentaire (alors que l’erreur probable annoncée correspond 4-5 x 107? fois 
la plus petite division, la tache de diffraction du télescope représente, à elle seule, 
40 fois autant); (v) la présence d’un opérateur, nécessaire pour lire le résultat de la 
mesure, produit une perturbation gravitationnelle environ 200 fois plus importante 
que l’erreur probable. 

2. Pour ces raisons (et quelques autres), R.H. Dicke, R. Krotkov et P.H. Roll 
furent amenés à refaire l’expérience d’ Eötvös, en remédiant aux difficultés signalées 
plus haut. L'expérience de Dicke est un peu différente dans son principe, en ce 
qu’elle utilise le champ de gravitation dû au Soleil, c’est-à-dire l’accélération de 
la Terre tombant sur le Soleil. 

Bien que l’accélération due au Soleil soit environ deux fois plus faible [-62 cm/s?] 
que celle correspondant à la force centrifuge due à la rotation de la Terre [1.4cm/s”], 
une telle expérience présente plusieurs avantages. D’abord, l’appareil est fixe, ce 
qui évite d’avoir à le retourner (échange des masses À et B) : ce retournement a 
lieu automatiquement toutes les 24 heures, en raison de la rotation apparente du 
Soleil autour de la Terre. Ceci, en évitant une manipulation, élimine ipso facto une 
source d'erreur, Ensuite, un résultat positif éventuel de l’expérience se traduirait 
par un mouvement périodique, de période 24 heures, de l’équipage mobile du 
pendule [Fig. 7.5]. Pour le voir, supposons que l’un des poids, A par exemple, 
de l’expérience d’ Eétvés—Dicke, tombe vers le Soleil un peu plus rapidement que 
l’autre, B. Supposons en outre que l’expérience débute à 0 heure, l'appareil étant 
par définition à l’équilibre. Six heures plus tard, la Terre a effectué un quart de tour 
et, du fait des forces appliquées en À et B (qui sont différentes par hypothèse), la 
position d'équilibre du pendule a varié. Six heures après — soit douze heures après le 
début de l’expérience — la position du pendule est à l’opposé de sa position initiale, 
etc. Ceci se traduira par un signal de période 24 heures dans la position d’équilibre 
du pendule. 

Cependant, à côté des avantages indiqués plus haut, existent aussi quelques in- 
convénients, comme la faiblesse déjà mentionnée de l’accélération des corps “tom- 
bant” vers le Soleil, telles les perturbations diurnes (marées, effets de température 
induits par le cycle jour-nuit, etc.) qu’il convient d’éliminer très soigneusement. 

Examinons maintenant rapidement comment R.H. Dicke et ses collaborateurs 
(1964) ont pu remédier aux difficultés de l’expérience d’ Eötvös et, en conséquence, 
ont pu augmenter sa précision. 

D'abord, l’ensemble de l’appareil (Fig. 7.6] est enterré dans un puits, soigneu- 
sement isolé thermiquement, la température et l’un de ses gradients pouvant être 
enregistrés à distance. L'équipage du pendule est conçu de telle sorte que Fin- 
fluence des gradients du champ de gravitation soit minimale, contrairement au 
cas de l’expérience d’Eôtvôs : la disposition des poids, aux sommets d’un triangle 
équilatéral, permet de diminuer le moment quadrupolaire de l’équipage du pendule. 
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Figure 7.5 : Variation périodique de la position d’équilibre du pendule d’Eötvös-Dicke. Si les 
deux masses A et B subissent des forces horizontales nettes différentes (dans le cas où mia/MgaF 
mis/™Mgp), cela se traduit par une variation périodique (de période 24 heures) de la position 
d'équilibre. La figure indique, de manière exagérée, d'éventuelles positions d'équilibre toutes les six 
heures, ce qui correspond à une rotation de la Terre de 90°. Rappelons que la position du pendule par 
rapport à la Terre est fixe. Le cadran gradué indique donc la position de la Terre par rapport au Soleil. 
Notons le renversement de A (en noir) et de B (en grisé) toutes les douze heures. 


Celui-ci est constitué de deux poids de cuivre et d’un poids d’or (ou de chlorure 
de plomb, de cuivre, de platine, etc.) suspendus à un cadre de quartz (un matériau 
très stable à de nombreux égards : insensibilité au champ magnétique terrestre, 
difficulté à être chargé électriquement, rigidité, etc.). Enfin, l’ensemble du pendule 
de torsion est enfermé dans une enceinte au sein de laquelle règne un très bon vide 
(1078mm de mercure), ce qui permet de réduire sensiblement les effets d'éventuels 
gradients de température ou des fluctuations de la pression sur l’équipage mobile, 
dues au gaz résiduel. 

A ces précautions, afin de prévenir l’excitation éventuelle de modes d’oscilla- 
tions non linéaires (du pendule) à des périodes de 24 heures, l’équipage est amorti 
électroniquement par un système de rétroaction : ces modes peuvent, en effet, être 
excités par de nombreux phénomènes tels que des ondes sismiques. Parmi ces 
modes, outre les modes de torsion, existent également des oscillations d'ensemble, 
l’oscillation de la fibre de quartz agissant alors comme un ressort. Il convient donc 
de les amortir car, en fait, ils tendent à changer le zéro de la position du pendule de 
manière aléatoire. 
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Figure 7.6 : Le pendule de Dicke /d’aprés P. Roll et al. (1964)]. 


Enfin, la position de l’équipage mobile du pendule est mesurée à distance, sans 
intervention d’un expérimentateur. Un faisceau lumineux est réfléchi sur l’un des 
barreaux de quartz du pendule et sa déviation traduite sous forme électrique par une 
cellule photoélectrique. Ce signal est ensuite utilisé de façon à ramener le pendule 
au zéro, la force exercée étant, elle, enregistrée. Ainsi, sur une période d’environ 
10 s, ce système permettait de déceler une déviation angulaire de l’ordre de 1077 
degrés. 

Finalement, cette expérience conclut à l’égalité de la masse inerte et de la masse 
grave avec la précision [P.G. Roll et al. (1964)] : 


M Mel 15x10! (à lo). 


Mg 


3. Les principales limitations de cette expérience étaient les perturbations 
sismiques, les effets thermiques et les gradients du champ de gravitation [voir la 
discussion de F. Everitt (1975)], aussi n’est-il guère étonnant que cette expérience 
ait été reprise avec un pendule possédant un moment quadrupolaire plus faible et 
un meilleur environnement sismique. Ainsi V.B. Braginsky et V.I. Panov (1971) 
donnent 


Mi Mel c 45 x 10722 (à lo); 


Mg 


toutefois cette expérience a été parfois critiquée. 

4. Plus récemment E.G. Adelberger et al. (1990) ont beaucoup perfectionné 
l’expérience d’Eôütvôs et ont également testé le principe d’équivalence faible dans 
le champ de gravitation de la Terre. Comme nous l’avons déjà mentionné au 
chapitre 1, ils entendaient principalement tester plusieurs modèles possibles pour 
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une éventuelle cinquième force. Néanmoins, ils ont légèrement amélioré le résultat 
de Roll ef al. (1964) et, au niveau d’un sigma, ils obtiennent 


(.2+1.0) x 10-" pour le couple Cu/Be 


m (.51.3) x 1071! pour le couple Al/Be . 


5. Mentionnons enfin, pour terminer ce paragraphe, une expérience spatiale ? 
étudiće par F. Everitt et P.W. Worden (1974, 1975, 1978) qui devrait permettre une 
détermination du rapport m;/m, avec une précision de l’ordre de 10717 et même, 
dans des versions plus élaborées, de l’ordre de 107% ! Le principal avantage d’une 
expérience spatiale réside dans l’élimination des vibrations (aléatoires) d’origine 
sismique, qui constituent la limitation la plus importante des expériences de 
laboratoire. En outre, l’accélération que l’on peut obtenir dans une telle expérience 
— celle qui fait intervenir la masse d’inertie — est beaucoup plus importante que celle 
due à la rotation de la Terre. Cependant, une expérience du type Eötvös, réalisée 
à bord d’un satellite, ne peut guère donner une précision supérieure à 10714 ou 
10715 : en effet, le mouvement du satellite le long de sa trajectoire introduit, au 
cours du temps, des gradients du champ de gravitation — et ce, d’autant plus que 
l'orbite est plus excentrique — dont l’effet ne pourrait être séparé de ce que l’on 
recherche qu’au prix d’une durée exagérée de l’expérience. Il est donc nécessaire 
de recourir à un autre type de mesure. 

Le principe en est le suivant [Fig. 7.7]. Deux cylindres coaxiaux, constitués 
de matériaux différents, sont mis en orbite, l’axe commun des deux cylindres 
conservant une direction fixe dans l’espace. Chacune des deux masses est soumise 
à l’attraction de la Terre, d’une part, et à l’accélération centrifuge orbitale, d’autre 
part. Une quelconque différence dans la chute de l’un des corps vers la Terre se 
traduira par un déplacement relatif périodique des deux cylindres. Ce déplacement 
est évidemment très faible : pour obtenir une précision sur le rapport m;/m, 
d’environ 10717, on doit pouvoir mesurer un déplacement relatif inférieur à 
1A! Une telle mesure nécessite évidemment des techniques très particulières 
[techniques cryogéniques, W.M. Fairbank (1974)] pour pouvoir mettre en évidence 
un déplacement aussi petit, et ce, sans parler de la nécessité d’études préalables 
d’effets perturbateurs de toutes sortes : mouvements du satellite, “marées” de 
l’hélium liquide dans son réservoir (nécessaire pour l’obtention de très basses 
températures) ... même la position des divers composants électroniques n’est pas 
(gravitationnellement) indifférente ! 

6. Examinons maintenant dans quelle mesure le principe d’équivalence faible est 
satisfait par les diverses interactions rencontrées dans la Nature : électromagnéti- 
ques, fortes, faibles et gravitationnelles. Il est clair a priori que les interactions 
gravitationnelles au sein d’un noyau, étant d’ordre Gmproton/Rnoyauc? ~ 10739, 
sont tout à fait négligeables; aussi nous limiterons-nous aux autres types de force. 


3. Cette expérience, appelée STEP (Satellite Test of the Equivalence Principle), acceptée d’abord par 
PESA (European Space Agency), en avril 1991, a malheureusement été repoussée. 
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satellite 


Figure 7.7 : Principe d’une mesure spatiale du rapport m;/m,. Deux cylindres coaxiaux A et B, 
constitués de deux substances différentes, sont mis en orbite autour de la Terre. Si l'un des corps tombe 
plus vite que l'autre vers la Terre, cela se traduira par un mouvement relatif de A et B périodique (avec 
la période du satellite). 


Pour trouver l’ordre de grandeur de ces effets, supposons que l’interaction de 
type K viole (faiblement) le principe d'équivalence faible, de sorte que l’on puisse 
écrire 


E 
MG =M; + ò NK = (7.8) 
K 


où 7x est un “coefficient de violation” qui dépend de la nature K de l’interaction 
considérée, tandis que EX est la contribution à l’énergie interne du corps étudié 
(dans une expérience du type Eötvös) pour le même type d’interaction. Pour deux 
corps de compositions différentes À et B situés dans le champ de gravitation g, 
l’accélération est donnée par 


7 Ex(A ou B) 
(Aon) = 14 ne Ra | , (7.9) 
de sorte que le rapport 
an A-B) 2 Ex(A) Ex(B) 
182 nt) 2M Sma mme) (10 


constitue une mesure de la violation du principe d’équivalence faible, mesure 
dont nous avons vu plus haut qu’elle fournit |n| < 1071! ou 10-12 suivant les 
expériences réalisées. Ainsi, en attribuant toute la violation éventuelle de légalité 
my = mg à l'interaction de type K, on obtiendra une borne supérieure pour ng. 

A titre d’exemple, considérons un noyau composé de À nucléons dont Z protons. 
Son énergie électrostatique est donnée par 


3 Ze? 


e= ERA 


(7.11) 
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où l’on a utilisé la relation semi—empirique qui fournit le rayon d’un noyau, 
R= Rj A‘? (Ro = 1.24 x 107 cm), supposé uniformément chargé. Pour deux 
corps aussi dissemblables que le platine (Z = 78, A = 195) et l’aluminium (Z = 
13, A = 27) utilisés dans ces expériences — donc qui pourraient éventuellement 
donner lieu à un effet perceptible — on a 


Ecs(Pt) _ Ees(Al) 
mi(Pt)  mi(AË 


et, finalement, n < 1078 — 107°. Cet exemple, extrêmement simple, montre 
non seulement que les interactions électrostatiques ne violent pratiquement pas 
l’équivalence faible, mais encore la nécessité de modèles décrivant la matière et 
la façon dont interagissent ses divers composants : ici, le noyau a été assimilé à 
une sphère uniformément chargée et l’on a utilisé une formule semi-empirique 
fournissant son rayon. 

On utilise, généralement, pour les interactions nucléaires une formule semi- 
empirique * bien établie qui fournit l’énergie de liaison d’un noyau [A, Z], 


~ 1073, 


z2 A-272} 
Eguci.(MeV) = 15.68 A — 18.56 42/3 — 0.717 ais 28.1 | 


+ Ep, 


(7.12) 
expression dans laquelle on peut reconnaître, compte tenu de la relation R = 
Ry A'S, I’ énergie de liaison par nucléon, |’ énergie de surface du noyau, son énergie 
électrostatique et où Ep est une énergie d’ appariement donnée par 


12 
Ep 4a)? REUT Gas 
Le cas des interactions électromagnétiques autres qu’électrostatiques, à F inté- 
rieur du noyau, est beaucoup plus complexe car il requiert un modéle détaillé 
de la structure nucléaire. Ces interactions donnent lieu, en effet, à des forces 
magnétostatiques dues aux courants de protons au sein du noyau, d’une part, et à des 
forces entre les spins des nucléons et les champs magnétiques qu’ils engendrent, 
d’autre part. 
De même, l'énergie de liaison des électrons atomiques peut être estimée 
[M.G. Bowler (1976)] à partir du modèle d’atome de Thomas—Fermi, qui fournit ® 


(7.13) 


Ex. = 15.73.2773 , (7.14) 


et donc la valeur de nat.. 

Les interactions faibles nécessitent également, pour pouvoir être considérées, 
un modèle précis du noyau dans lequel les nucléons interagissent faiblement via 
la théorie de Weinberg-Salam. Ceci a été calculé par M.P. Haugan et C.M. Will 


4. Cf. L. Valentin (1975). 
5. L.D. Landau, E.M. Lifschitz, Mécanique Quantique. 
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(1976) qui donnent faible S 107? tandis qu’un calcul d’ ordre de grandeur basé 
sur le modèle de Fermi [M.G. Bowler (1976)] fournit faible S 1071 — 107? si 
l’on accepte 6m/m < 107! et Nfaible S 107! si l’on se limite aux résultats de 
R.H. Dicke et al., soit 6m/m S 10711. Il n’est donc pas totalement évident que 
les interactions faibles obéissent bien au principe d'équivalence [voir également 
J.P. Hsu (1978)]. 

Le tableau 7.1 résume ces différents effets. 


Nature de l’interaction n= violation de m,=m,; 
Interactions électrostatiques (noyau) Mes <4X 107 10 
Interactions magnétostatiques (noyau) Tins <6X 107° 
Couplages des moments magnétiques des nucléons nur <2X1077 


avec le champ magnétique des protons 


Interactions électrostatiques des électrons atomiques nre <5x1077 
Interactions nucléaires nuci <5 x 10710 
Forces gravitationnelles entre nucléons Ngrav <10+ 271 
Interactions faibles faible <10 7? 


Tableau 7.1 : Bornes supérieures d’éventuelles violations du principe d’équivalence faible, pour 
différents types d’interactions, déduites des expériences du type Eötvös /d’après C.M. Will (1981)]. 
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Nous venons de voir que le principe d’équivalence faible est bien vérifié, 
expérimentalement parlant. Nous allons maintenant énoncer ce principe dans toute 
son extension et examiner ses principales conséquences et, en particulier, dans 
quelle mesure il est, lui aussi, vérifié au niveau expérimental. Nous utiliserons la 
formulation de C.M. Will (1981) qui, outre la précision, possède l’avantage de bien 
séparer les différentes hypothèses effectuées. 

Principe d'équivalence d’Einstein : (i) la masse inerte d’un corps est égale à sa 
masse grave (passive), (ii) l’issue de toute expérience non gravitationnelle locale 
est indépendante de la vitesse de l’appareillage dans un système en chute libre; 
(iii) l'issue de toute expérience non gravitationnelle et locale 6, est indépendante 
de l’endroit et de l’époque où elle est réalisée [C.M. Will (1981)]. 

1. Cet énoncé appelle un certain nombre de remarques. Nous avons déjà 
commenté le point (i) — l’équivalence faible — et avons indiqué qu’il était très bien 


6. ... de masse négligeable, de sorte que le champ gravitationnel puisse toujours être ignoré, dans le 
système en chute libre. L'expérience apparaît ainsi comme une “particule-test”… 
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vérifié expérimentalement. Il subsiste, toutefois, des situations où il pourrait ne pas 
être valable. Ainsi, particules et antiparticules tombent-elles de la même manière 
au sein d’un champ de gravitation? La réponse (expérimentale) est positive, à 
une approximation convenable, en ce qui concerne les électrons et positrons [voir 
la discussion de M.G. Bowler (1976)], le système 7” KoKo [M.L. Good (1961), 
les neutrinos et antineutrinos ê [S. Pakvasa, W.A. Simmons, T.J. Weiler (1988). 
De même, mesure-t-on (quoique de manière non concluante) l’universalité de la 
chute libre d’un électron (W.M. Fairbank, F.C. Witteborn, L.V. Knight (1968)] ou 
de neutrons [L. Koester (1976); V.F. Sears (1982)]. 

De maniére générale, un comportement différent des particules et des antipar- 
ticules dans un champ de gravitation impliquerait une brisure de l’invariance 
par conjugaison de charge. Celle-ci est vérifiée expérimentalement à mieux que 
5 x 1076 près; il est donc raisonnable d’affirmer que les antiparticules obéissent 
au principe d'équivalence faible à probablement mieux que 1074 près. 

2. Une situation importante où l’équivalence faible pourrait ne pas être vérifiée 
concerne |’ interaction gravitationnelle elle-même. En effet, les expériences du type 
Eötvös ne peuvent être utilisées à cet effet, en raison de la faiblesse même de ce genre 
d'interaction : elles fournissent Ngrav < 10+27! Aussi est-il nécessaire d’utiliser 
des objets très massifs, tels la Terre et la Lune dans le champ de gravitation du 
Soleil ou bien Mars et Jupiter dans ce même champ. Si era désigne le “coefficient 
de violation” de l’équivalence faible par l’interaction gravitationnelle, donc si l’on 
pose 


Egrav. 


Merav. = Min. + Nerav. (7.15) 


les équations du mouvement de la Terre et de la Lune, dans le champ de gravitation 
du Soleil, s’écriront 


X MGT TrMo mer (fr — Zz) 
VITE a a a eet GE 
mır |r — Ës| MIT |fr—- Z| 
5 hes Aes (7.16) 
5 MGL TL Mo MGL n~ (TL — Žr) 
QE = Ce G = 3 MGT 
min |t — čsl mit |r — Zz] 


où les indices T, L, S se rapportent, respectivement, à la Terre, la Lune et le Soleil 
(Mo désigne la masse grave active du Soleil). L’accélération relative Terre/Lune, 
due à la violation éventuelle de mr = mc, est alors donnée par 


Ÿ = YL T ïr à l’ordre Nerav) (7.17) 


7. Il semble bien que l’argument de Good ne soit pas correct [T. Damour]; il est, en effet, basé sur 
l’utilisation du champ de gravitation classique ¢, alors que seul V¢ possède un sens (alors que seul 
VV¢enaun en Relativité Générale). 

8. Si les neutrinos considérés sont des neutrinos de Majorana, alors ce qui est testé est l'égalité de la 
chute libre des neutrinos droits et gauches. 
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=. G | Egrav (Terre) Egrav (Lune) (Zs — TT) 
= v = OTS 5 
ne Min, (Terre)c? Min (Lune)c? Ts = Ēri? 
_ (Z: — fr) a G | eee Pere tar Mgrav. (Lune) Esrav. (Terre) 
x TA rav. SS ee, eS 
|, — Z7\° 3 Min, (Lune)c? Min. (Terre)c? 


(7.18) 


Tandis que le second terme est une correction purement quantitative au mou- 
vement relatif Terre/Lune, mouvement circulaire à une bonne approximation, le 
premier terme de l’ équation (7.18) représente une modification qualitative; c’est 
cettte modification qui donne lieu à ce qu’on appelle I’ effet Nordtvedt [K. Nordt- 
vedt (1968)]. Un calcul simple [C.M. Will (1981)] montre que la trajectoire de la 
Lune est alors légèrement “polarisée” vers le Soleil [Fig. 7.8]. Si l’on admet, par 
exemple, que la Terre et la Lune sont des sphéres de densité uniforme, alors leur 
énergie gravitationnelle 


(avec effet Nordtvedt) 
trajectoires de la 
A Lune 
(sans effet 
Nordtvedt) 


Figure 7.8 : L’effet Nordtvedt. Si la Terre et la Lune ne “tombent” pas avec la même vitesse vers le 
Soleil, alors la trajectoire de la Lune est légèrement modifiée et est déformée dans la direction du Soleil 
(la déformation a été trés fortement exagérée sur la figure). 


Egrav. = = = ; (7.19) 


divisée par Minc?, vaut —4.6 x 10710 pour la Terre et —2 x 1071! pour la Lune; 
ce qui donne la déviation (en centimètres) 


ôr(t) © 920 Mgrav. COS [(wo — ws) t] , (7.20) 


où wo est la vitesse angulaire de la Lune autour de la Terre et ws la vitesse angulaire 
du Soleil autour de la Terre. 

Les résultats de cette expérience donnent fgrav. = -00 + .03 [J.G. Willams et al. 
(1976)] et Ngrav. = 001 +.015 [LI. Shapiro, C.C. Counselman, R.W. King (1976)], 
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selon deux analyses indépendantes des mêmes données : autrement dit, les valeurs 
trouvées pour Ngrav. Sont compatibles avec la valeur zéro. Ceci correspond à une 
égalité entre masses grave et inerte de la Lune de l’ordre de quelques 107+. 

Il faut enfin souligner que ces mesures constituent des expériences gravitation- 
nelles qui vont donc au-delà du principe d'équivalence fort énoncé plus haut; elles 
entrent plutôt dans le cadre du principe ultra-fort (voir plus loin). 

Ajoutons encore l’idée récente avancée par T. Damour et al. (1991) d’utiliser 
les données fournies par les pulsars binaires PSR 1913+16, PSR 1953+29 et 
PSR 1855+09, pour mettre en évidence une éventuelle violation à un ordre supérieur, 
i.e. à l’ordre [Egrav/mc?]?. 

3. Le point (ii) du principe d'équivalence affirme que, dans un référentiel en 
chute libre, donc localement inertiel, les expériences (non gravitationnelles) de 
physique sont indépendantes de vitesses uniformes imprimées à |’ appareillage : il 
s’agit donc de l’invariance de Lorentz qui doit y être satisfaite. Nous avons déjà 
discuté rapidement, au chapitre 3, des vérifications expérimentales de la Relativité 
Restreinte et du cadre théorique dans lequel elles se situent, vérifications qui, 
presque toutes, sont de nature locale. 

Le point (iii), enfin, exige que les lois de la physique soient les mêmes 
partout dans l Univers et ce, à toute époque. L’invariance spatiale est testée par 
les expériences portant sur le décalage gravitationnel vers le rouge [R.V. Pound, 
G.A. Rebka (1960); R.V. Pound, J.L. Snider (1965)] ou la comparaison d’horloges 
transportées dans des avions ou des fusées [voir C.M. Will (1981) pour les détails}. 
Là encore le principe d'équivalence est bien vérifié (voir plus loin pour le décalage 
gravitationnel vers le rouge). 

En ce qui concerne les lois de la physique, dont on exige la validité à toute 
époque, il mest guère possible que d’en supposer fixe la forme et d’obtenir des 
limites supérieures à la variation des constantes qui y interviennent, telles la 
constante de structure fine e? /ħc, celle des interactions fortes, etc. En fait, si les 
constantes fondamentales de la physique variaient, méme faiblement, au cours du 
temps, toutes sortes de phénomènes très divers seraient alors observés : les spectres 
atomiques ou nucléaires seraient modifiés, les propriétés de stabilité des noyaux, 
les rayons des planètes et leur évolution orbitale, la nucléosynthèse des éléments 
légers (cosmologie) et lourds (étoiles), etc., bref toutes sortes de phénomènes 
physiques, géophysiques ou astrophysiques en indiqueraient les conséquences. Un 
bon nombre de ces effets sont résumés et analysés brièvement par P. Sisterna et 
H. Vucetich (1990). Le tableau 7.2 fournit une idée de l’ordre de grandeur de 
la variation des constantes de couplage des quatre interactions fondamentales °? 
[voir également C.M. Will (1981), J.M. Irvine (1983)]. Nous allons donner un petit 
nombre d'exemples pour indiquer comment sont évalués ces chiffres dans quelques 
cas très simples. Notons, toutefois, que J. Bekenstein (1982) a critiqué ces résultats, 
arguant de la nécessité de modèles dynamiques pour l’évolution des constantes de la 


9. Il est également nécessaire de considérer d’éventuelles variations temporelles d’autres grandeurs 
telles les masses de particules, etc. 
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physique. Il a donné un tel modèle pour les interactions électromagnétiques, basé 
sur des postulats naturels, et a conclu que les résultats précédents n’indiquaient 
qu’une constance marginale de e?/ħc. Il a cependant montré que les expériences 
du type Eötvös permettaient de conclure à la constance spatiale et temporelle de 
e? /hħc. 


Grandeurs Bornes supérieures sur Auteurs 
les variations annuelles 


G 10711 Damour et al. (1988) 
e? 10714 Davies (1972) 

e? 10717 Shlyakhter (1976) 
nucl 10718 Shlyakhter (1976) 
Qnucl | 10714 Davies (1972) 
Gfaible 1077? Shlyakhter (1976) 
Gfaible 10710 Davies (1972) 


Tableau 7.2 : Quelques ordres de grandeurs pour les bornes supérieures de la variation annuelle 
des constantes de couplage des interactions connues, en supposant dans chaque cas que seule la 
constante de couplage considérée varie au cours du temps. Les chiffres de Shlyakhter sont basés sur 
l'analyse des données du réacteur nucléaire naturel d’Oklo [M. Maurette (1976); J.M. Irvine (1983); 
Y.V. Petrov (1977)]. 


Donnons d’abord l’exemple d’une éventuelle variabilité de la constante de 
gravitation G et, à cette fin, considérons un objet de masse m en orbite circulaire 
(du moins pour obtenir un ordre de grandeur) autour d’un autre objet mais de masse 
M. Soit R le rayon de l’orbite; on aura donc 


GMm mu? 
= SS SS (7.21) 
R2 R 
en équilibrant l’attraction gravitationnelle et la réaction centrifuge, où v est une 
constante. La période de la “planète” de masse m est alors 


qui fournit donc, par dérivation, le taux de variation de T et de R, si G varie au 
cours du temps, 


1dT 31dR 1 1 dG 
Td  2Rdt 2G d` 
Ainsi les orbites et les périodes des planétes auraient été différentes dans le 
passé, les dates des éclipses seraient changées, etc. [V. Canuto (1990)]. Toutes les 
mesures effectuées concluent, finalement, à une variation relative |G/G| < 1071! 
par an, en supposant, bien entendu, que M (et les interactions qui y contribuent) 
ne varie pas avec le temps. 
Prenons maintenant le cas de la constante de structure fine a = e?/hc. Celle- 
ci intervient proportionnellement à son carré dans la position des raies émises 


(7.22) 
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par les atomes. Si l’on observe des objets très lointains 10 comme les quasars 
[J.N. Bahcall, E.E. Salpeter (1965); J.N. Bahcall, W. Sargent, M. Schmidt (1967)] 
ou des radiogalaxies [J.N. Bahcall, M. Schmidt (1967)], la lumière émise l’a été 
il y a quelques milliards d’années. Aussi la comparaison des raies des quasars 
(ou de radiogalaxies lointaines} avec les raies observées en laboratoire permet- 
elle de trouver des limites pour la variation de la constante de structure fine a au 
cours du temps. Comme la fréquence d’une raie est proportionnelle à a, on aura 
v/v = 2à/a et l’on trouve &/a < 1071? par an. 

Un autre argument concernant la variabilité éventuelle de la constante de 
structure fine [P.J. Peebles et R.H. Dicke (1962); F.J. Dyson (1967); P.C.W. Davies 
(1972)], que l’on peut élaborer davantage, repose sur la remarque que deux 
isobares 1} ont une masse qui, grosso modo, diffère pratiquement par le terme 
coulombien qui intervient dans la formule de masse [Eq. (7.12)] 


Z2 


Ecou = -717 PTE (en MeV), (7.23) 


laquelle est, implicitement, proportionnelle à e?. C’est pourquoi, dans une 
désintégration 3 (ou une capture 8) entre deux isobares!! 


ZX >p teti 


(7.24) 
4X — å aX +et +r, 
l'énergie emportée par les leptons 1? dépend de la différence A Ecoul, 
2Z -1 i 
AM = ABni = -717 y (MeV). (7.25) 


Si, en outre, le temps de vie de l’élément ax est suffisamment long pour que 
e? ait pu varier de manière appréciable sur un tel intervalle de temps, alors on aura 


1 6AM iða 


AM ôt ast’ Ve 


ce qui se traduira dans le temps de vie de x et donc dans les abondances relatives 
des deux isobares. De tels couples d’isobares existent et, notamment, le couple 
rhenium/osmium (A=187) dont PJ. Peebles et R.H. Dicke (1962) ont très tôt 
souligné l'intérêt car le temps de vie du rhenium est de l’ordre de 4 x 101? ans; il 
est malheureusement trés délicat 4 mesurer en laboratoire. 


10. Cela, en admettant que le décalage spectral vers le rouge observé dans les quasars est d’origine 
cosmologique : ceci est généralement admis. 


11. Noyaux qui possèdent le même nombre A de nucléons et qui diffèrent donc par leur nombre Z de 
protons (ou d’électrons). 


12. Particules légères : e,ve,e* „De, etc. 
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Cependant, les estimations les plus précises d’une variabilité éventuelle des 
diverses constantes de couplage [A.I. Shlyakhter (1976)] proviennent de l’étude 
des abondances isotopiques dans le “réacteur naturel” d’Oklo (Gabon). Il s’agit, 
en fait, d’une concentration fortuite d’uranium 235, suffisante pour que deux 
milliards d’ années auparavant, elle se soit spontanément “allumée”; cela se traduit 
notamment par un pourcentage d’uranium 235 dans le minerai beaucoup plus faible 
que l abondance normale sur Terre (.72%). L’ abondance relative de deux isotopes du 
samarium (147 et 149), plus basse à Oklo qu’elle ne devrait, indique une irradiation 
par les neutrons produits dans la fission de l’uranium environ 1.8 x 10° années 
auparavant. Ceci fournit alors de manière extrêmement précise la valeur de la 
section efficace de capture résonante du neutron, du samarium 149, il y a 1.8 x 109 
années, et permet donc la comparaison avec les valeurs mesurées aujourd’hui en 
laboratoire. Ceci conduit alors aux valeurs indiquées par A.I. Shlyakhter (1976). 
On trouvera un exposé clair et assez détaillé dans l’article de J.M. Irvine (1983). 

Bien entendu, les valeurs numériques données précédemment supposent impli- 
citement que les autres constantes de la physique ne varient pas non plus au cours 
du temps. Ainsi la constante de Planck, la masse de l’électron ou du proton, etc., 
sont supposées fixes [une étude de la variabilité du rapport de la masse du proton à 
celle de l’électron, effectuée à partir de l’ analyse des raies d’ absorption de quasars, 
a été réalisée par B.E.J. Pagels (1977)]. Une discussion rapide de la variabilité 
éventuelle de la masse peut être trouvée dans H.C. Ohanian (1976). 

En conclusion, il n’existe à l’heure actuelle aucune indication d’une modification 
quelconque des lois de la physique au cours du temps et, dans une certaine mesure, 
avec la position dans l’espace : le principe d'équivalence est, finalement, bien vérifié 
dans chacune de ses hypothèses et de leurs conséquences. 

4. L'importance du principe d'équivalence provient non seulement de ses bases 
expérimentales très diverses mais encore du fait qu’il implique, pratiquement, 
le recours à un espace-temps (localement) courbe à quatre dimensions muni 
d’une métrique g, (x) traduisant l'existence d’un champ de gravitation. Insistons 
cependant sur le fait que ce principe n’indique rien sur les lois auxquelles doit 
obéir le tenseur métrique : un grand nombre de théories, dont la Relativité Générale 
d’Einstein, satisfont le principe d’ équivalence et diffèrent par les équations vérifiées 
par le tenseur métrique et/ou les champs classiques additionnels supposés décrire 
la gravitation. En tout état de cause, la matière est toujours couplée au tenseur 
métrique, de telle sorte que dans un système localement inertiel (en chute libre), 
les lois de la physique (non gravitationnelle) sont les lois relativistes restreintes 
habituelles. 

Nous pouvons donc, désormais, trouver les lois de la physique, en espace- 
temps courbe, à partir des lois relativistes usuelles : il suffira, généralement, de 
remplacer (mentalement) les indices lorentziens par des indices tensoriels afférents 
à des changements de coordonnées généraux sur la variété espace-temps V4 et de 
remplacer les dérivées usuelles par des dérivées covariantes 


(a) ð > (b) Vp. (7.27) 
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de rajouter à V, des termes dépendant de la courbure pour obtenir d’autres 
généralisations des équations minkowskiennes. Par exemple, l’équation 


Vu FM + SHR YY op Fk = 4nd” (7.32) 


peut constituer une telle généralisation non minimale : en Il’ absence de gravitation 
le tenseur de courbure est identiquement nul et l’on retombe sur les équations de 
Maxwell habituelles après avoir choisi des coordonnées lorentziennes. 

On voit donc que le principe d’équivalence ne fixe pas complètement le couplage 
de la matière et de la gravitation. 

5. Pour conclure cette section, abordons rapidement le principe d'équivalence 
ultra—fort. Nous avons déjà noté plus haut que l’absence d’effet Nordvedt constitue 
déjà une indication sérieuse de la validité de ce principe en ce qui concerne l'égalité 
des masses grave et inerte : l’énergie gravitationnelle n’est pas différente des autres 
formes d’énergie pour ce qui est de sa contribution à la masse grave. 

Une violation du principe d’équivalence ultra-fort se traduirait, par exemple, 
par la dépendance d’une expérience gravitationnelle locale de tout le contexte 
gravitationnel global, cosmologique, voire de l’existence éventuelle de champs 
à très longue portée. Si, au contraire, le principe est vérifié, cela signifie que les 
différents champs présents dans la Nature sont toujours couplés de la même manière, 
indépendante du lieu et du temps et avec des couplages constants, indépendamment 
de toute structure cosmologique. A cet égard, l’expérience de Hughes et Drever 
permet d'éliminer, avec une bonne approximation, de tels champs supplémentaires 
[C.M. Will (1981)]. 

Un exemple de violation de ce principe [V. Canuto et I. Goldman (1983); 
V. Canuto (1990)] peut être trouvé dans l’inéquivalence éventuelle des horloges 
usuelles (atomique, nucléaire, etc.) et gravitationnelle : un choix compatible avec 
le fait que la gravitation est la seule interaction importante à l’échelle cosmologique. 
Cette inéquivalence doit se traduire par un facteur d’échelle, dépendant du temps, 
entre les intervalles indiqués par une horloge gravitationnelle, soit dsgray, et ceux 
marqués par une horloge atomique, soit dSat. : 


dSgrav = (t) dsat. (7.33) 


avec (to) = 1. Les données observationnelles (réflexions laser sur la Lune ou 
radar sur les planètes intérieures) ou géophysiques donnent {(t) < 1071} an7?. 


La notion d’horloge gravitationnelle et celle d’horloge atomique évoquées ci-dessus 
nécessitent quelques explications. Nous nous limiterons ici à des cas très simples, 
suffisants pour illustrer notre propos. Une horloge atomique, d’abord, ne fait intervenir 
que des forces électromagnétiques et obéit, par conséquent, au principe d'équivalence 
fort. Un exemple grossier est constitué par une particule de charge q et de masse inerte 
Min Orbitant circulairement autour d’une charge Zq, donc telle que 


et donc de période 
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R3m 


Tat = 27 Fa . 


Une horloge gravitationnelle, elle, fait intervenir des forces de gravitation, par l'in- 
termédiaire de sa masse grave mgrav, 


Egrav. 
Merav. = Mint N Er 


(n : coefficient de violation du principe d’équivalence; Egrav. : énergie gravitationnelle 
entrant en jeu). Une horloge gravitationnelle, similaire à la précédente (atomique), 
aura une période 


Tgrav. = 20 ig ne : 

Notons, au passage, que deux planétes ayant exactement les mémes caractéristiques 
[min,R], orbitant en étant soumises à la même étoile centrale de masse M, et de 
compositions chimiques différentes - donc de masses graves passives mg différentes — 
auraient des périodes orbitales différentes. . . Comparons maintenant le comportement, 
au même point, de deux horloges dont l’une est atomique et l’autre gravitationnelle 
(du type indiqué plus haut), en chute libre dans un champ de gravitation constant g. 
L’horloge atomique possède une vitesse de chute 


Vat = gt, 
tandis que Vhorloge gravitationnelle sera telle que 
Ugrav — TER gt = (1+7 =) gt. 


Ces deux horloges posséderont donc une vitesse relative 


Pii ia __ n TER gt + O(n?) , 


Fe 
1—vgrav Yat 


de sorte que, si les deux horloges avaient initialement la méme période, par effet 
Doppler longitudinal, on aurait maintenant 


AT grav = VAT at + O(v?) 


= n Ge gt ATart O(n”) . 


A cela, on peut ajouter que le coefficient 1 peut, lui aussi, dépendre du temps 
(à une plus grande échelle que celle marquée par les deux horloges; à une échelle 
cosmologique, par exemple); aussi, de manière générale, a-t-on bien une relation du 
type (7.33) ci-dessus. 
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Ayant admis que l’espace-temps en présence de gravitation peut être correcte- 
ment représenté par une variété métrique { V#, gau (x) } à quatre dimensions, nous 


allons en examiner quelques conséquences dont la première est un effet de dila- 
tation du temps, spécifiquement gravitationnel, qui se traduit notamment par un 
rougissement des photons [voir le chapitre 4 pour un raisonnement plus intuitif]. 


Considérons ce dernier effet [Fig. 7.9] et donc une transition atomique au point 


d’espace-temps 1 [1 = (x%,x1,x?,x%)] où règne un champ de gravitation g,, (1). 
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Figure 7.9 : Décalage gravitationnel vers le rouge. 


Le photon émis par |’émetteur, de quadrivitesse u” (1), est émis avec le 4—vecteur 
d'onde k” (1) et observé en 2 par un observateur de quadrivitesse u” (2). En 2 règne 
le champ de gravitation g,,,(2). L'énergie (de manière équivalente, la fréquence) 
du photon émis en 1 est 


EQ) = Muli = v(1) (7.34) 
tandis que celle du photon observé en 2 est alors 

E(2) = k“u,l2 = v(2); (7.35) 
E(1) et E(2) se réduisent bien, dans les systèmes au repos de l'émetteur et de 


l'observateur respectivement, aux fréquences v(1) et (2). Si l’on appelle z le 
décalage spectral, 


z= Aobs — Aem l (7.36) 
Aem 
alors on aura aussi 
Hk 
tg = Brem | (7.37) 
[utk,] obs 


Cette relation est tout 4 fait générale et s’applique dans de nombreux cas 
physiquement importants +3. Nous allons nous limiter ici au cas d’un champ de 
gravitation stationnaire, c’est-à-dire tel qu’il existe un système de coordonnées 
dans lequel 0:9,,,(Z,t) = 0; dans ces conditions, on peut toujours choisir des 
coordonnées telles que goi(Z) = 0. : 


L’équation (7.37) peut encore se réécrire sous la forme 


Of 
Len Eolas (7.38) 


[u° ko] ém 


13. Elle peut être utilisée pour obtenir le décalage cosmologique ou la formule de l'effet Doppler 
habituelie [G.F.R. Ellis (1971)]. 
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goo (ém) \ /? ko obs 

—— ——, (7.39) 

goo (obs) koém 

compte tenu de ce que g,,,u“u” = 1, et donc de ce que 
j 1 
0 
b= a 7.40 

goo ( ) 


dans un système de référence comobile. Comme, d’autre part, 0,9, = 0, la 
composante zéro du 4—vecteur d’onde k,, est conservée 14 Je long de la géodésique 
isotrope qui va de l’événement 1 à l’événement 2. Montrons-le rapidement. 
L’équation des géodésiques [voir aussi la section suivante] s’écrit 


Vku dk, 

— = = —— re Ko p = ; 

q 8 = g t Terk = 0 

(È : paramètre affine) (7.41) 


soit, en explicitant les symboles de Christoffel et en se limitant à la composante 
zéro de k,,, 


dk 
E — 4 [3pgoa + 90960 — 0a908] = 0. (7.42) 

Compte tenu de ce que 9, est diagonal et que Oo9ga = 0, il vient dko = 0 et 
donc ko obs = Ko ém,- Finalement, le décalage spectral est donné par 


1/2 
_ { 900 (ém) 


Nous verrons, dans la section suivante, que pour des champs faibles, la relation 
précédente se réduit à celle obtenue de manière heuristique au chapitre 4; le décalage 
spectral z est donc, généralement, proportionnel au paramètre gravitationnel 
GM/Rc?. Les valeurs de ce paramètre 15 — du moins pour les systèmes physiques 
connus avant les années soixante — laissaient penser que seules les naines blanches 
étaient susceptibles de donner lieu à un effet mesurable : z ~ 2x 1074, typiquement. 
La mesure a été effectuée [W.S. Adams (1925); J.L. Greenstein et V.L. Trimble 
(1967); G. Gatewood, J. Russel (1974); J.L. Greenstein et al. (1977); G. Gatewood, 


14. Cette propriété est un cas particulier du théorème suivant [K.S. Thorne (1971)] : Si le tenseur 
métrique Juv, dans un système de coordonnées donné, ne dépend pas de la coordonnée zÊ, alors la 
valeur numérique de la composante covariante B de la quadri-impulsion d'une particule massive ou 
d’un photon est conservée le long de sa trajectoire géodésique. Démonstration : identique à celle qui 
suit. 

15. Voir le tableau 4.1. 


178 Le principe d’équivalence 


C. Gatewood (1978); J. Hershey (1978); H.L. Shipman (1979); G. Wegner (1980)] 
et les résultats sont grosso modo en accord avec les prédictions de la relativité. 
Toutefois, ces observations comportent de grandes incertitudes en raison du fait 
que les raies des naines blanches sont trés souvent assez larges, de sorte qu’en 
mesurer un déplacement de l’ordre de 1074 est extrêmement délicat. 

Dans le Soleil, ce même problème existe nettement moins car les raies émises 
sont beaucoup plus fines. Par contre, l'effet à mesurer est d’ordre 2 x 106 
Cependant, le principal problème n’est pas tant de mesurer un déplacement de 
raies que le fait que l’atmosphère du Soleil est sujette à des mouvements de 
convection aléatoires qui entraînent des effets Doppler inconnus sur les raies 
observées. Comme ces courants convectifs sont à peu près verticaux, et que la 
ligne visée est perpendiculaire à ces mouvements au bord du disque solaire, en 
observant les raies émises dans cette région, ces effets sont, en partie, éliminés. La 
mesure, effectuée à plusieurs reprises [F. Roddier, J.E. Blamont (1961); J. Brault 
(1963); J.L. Snider (1972) (1974)], confirme la valeur donnée par la relativité avec 
une précision de l’ordre de 5%. 

Toutefois, la première mesure précise (environ 1%) du décalage spectral gra- 
vitationnel a été obtenue en laboratoire, donc sur Terre [R.V. Pound, G.A. Rebka 
(1960); R.V. Pound, J.L. Snider (1965)]. En effet, quoique le décalage spectral me- 
suré à deux niveaux différents [de l’ordre de 22 m dans l’expérience de R.V. Pound 
et G.A. Rebka (1960)] soit très faible (~ 10715), il est possible de produire des raies 
extrêmement fines en utilisant l’effet Mossbauer !$, des raies ayant des largeurs très 
proches de leur largeur naturelle 17. 

Par la suite, l'amélioration considérable de la stabilité des horloges (10715 — 
10716 pendant des temps de 10 à 100 secondes) a permis leur comparaison 
a différentes altitudes : par exemple, la comparaison d’une horloge (maser à 
hydrogène) !8 à terre et d’une horloge analogue placée à bord d’une fusée a confirmé 
la prédiction relativiste avec une précision supérieure à 2 x 1074 [R.FC. Vessot, 
M.W. Levine (1979); R.F.C. Vessot (1984)]. D’autres expériences vont toutes dans 
le même sens [C.M. Will (1981)]. 

Nous avons déjà indiqué l’importance théorique du décalage spectral d’origine 
gravitationnelle : il représente l’un des arguments les plus forts en faveur des théo- 
ries métriques de la gravitation relativiste (dont la Relativité Générale). Mais il 
fournit également une “démonstration expérimentale” du point (iii) du principe 
d’équivalence fort, c’est-à-dire de la non-dépendance d’expériences (non gravita- 
tionnelles) du lieu et de l’époque où elles sont réalisées. Une dépendance éventuelle 
se traduirait par un décalage spectral [C.M. Will (1981)] de la forme 


z = (1+a)AU/c, (7.44) 


16. Il s’agit de l'émission (ou de l’absorption) d’un photon, sans recul, par un solide cristallin à basse 
température. Voir, par exemple, A. Abragam (1964). 

17. Par exemple, la largeur de la raie y produite lors d’une transition ©’ Ga— 7Zn, à 93 KeV, est 
Av/ve5.2x10 16. 

18. Ce type d’horloge est décrit par R.F.C. Vessot (1974). 
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où AU est la différence de potentiel et où œ est un “coefficient de violation” : 
l'expérience de R.F.C. Vessot et M.W. Levine (1979) donne alors |a} < 2 x 1074. 


Mouvements géodésiques 


Considérons une particule de masse m, suffisamment petite pour que son champ 
de gravitation puisse être considéré comme négligeable, en mouvement dans un 
espace-temps riemannien {V*,g,,} : il s’agit donc ici du mouvement d’une 
particule-test et aucune interaction autre que la gravité n’est envisagée à ce stade. 
Ce cas simple doit être préalablement étudié si l’on souhaite établir une relation 
entre le tenseur métrique gy et le potentiel de gravitation ¢ usuel, du moins à la 
limite des vitesses faibles et des champs peu intenses. 

Dans un référentiel en chute libre, l'effet de la gravitation peut être annulé par 
un choix judicieux de coordonnées locales et la particule-test se meut selon un 
mouvement rectiligne et uniforme (localement) : le principe d'équivalence impose, 
en effet, que son mouvement soit, localement, celui qu’elle aurait dans l’espace 
de Minkowski. Elle décrit donc le plus long !° chemin spatio-temporel entre deux 
points, c’est-à-dire un arc de géodésique : 


6 fas = 0 (7.45) 


dz” dx’ |*/? 


Cette dernière équation donne lieu exactement au même type d’équations 
d’Euler-Lagrange, pour la description des géodésiques, que dans le cas de la 
Relativité Restreinte écrite en coordonnées curvilignes [Chap. 3], c’est-à-dire 


ou 


2 a 
ones (7.47) 
ds? eP ds ds 
où l’on a choisi d£ = ds. Il existe cependant — rappelons-le — une différence 
importante entre ces deux cas. En Relativité Restreinte, on peut toujours trouver un 
système de coordonnées global tel que g,,, se réduise à nyy et que TË g = 0, donc 


tel que l’équation des géodésiques (7.47) se réduise à la relation usuelle 


dx 
ds? 
Par contre, dans le cas de la gravitation relativiste, cela n’est possible que 
localement. Bien plus, si l'introduction de coordonnées curvilignes dans le cas de 


(7.48) 


19. Au sens de la métrique nyu- Il est facile de vérifier que le chemin décrit n’est pas le plus court : 
en effet, de A à B, séparés par un intervalle du genre temps, il est toujours possible de faire passer un 
chemin composé de deux droites isotropes. 
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la Relativité Restreinte est, généralement, un luxe inutile, il s’agit d’une nécessité 
absolue lorsque l’espace-temps est une variété courbe. En outre, alors que le 
tenseur 7,,, exprime seulement la structure du cône isotrope dans l’espace de 
Minkowski, g,,, traduit aussi l’effet de la gravitation via le tenseur de courbure. 
Notons encore que l'équation des géodésiques (7.47) aurait pu, tout aussi bien, 
être déduite de l’équation localement minkowskienne (7.48), valable en vertu du 
principe d’équivalence, en passant 4 un systéme de coordonnées arbitraires sur 
l’espace-temps V* considéré [voir, à ce sujet, S. Weinberg (1972)]. 

Revenons maintenant à l’équation des géodésiques (7.47). On en interprète 
parfois le second terme comme étant une force de gravitation et, corollairement, 
le tenseur métrique comme un potentiel de gravitation, les rs s'exprimant en 
fonction des dérivées des g,,,,. En fait, cette interprétation, purement formelle, est 
basée sur la seule analogie de l’équation (7.47) avec l’équation de la dynamique 
relativiste (3.65), et méconnaît le caractère “cinématique” (géométrique) de la 
gravitation. Fixant les propriétés métriques de l’espace-temps, elle en détermine 
également les géodésiques. A cela s’ajoute le fait que, pour déterminer une force, il 
est nécessaire d’évaluer les déviations du mouvement relativement à un mouvement 
libre; or, précisément, ce qui joue ici le rôle du mouvement libre est le mouvement 
géodésique, propriété géométrique (cinématique) par excellence. En réalité, c’est 
plutôt l’ensemble { OTA Ra gf qui joue le rôle d’un potentiel de gravitation : nous 


verrons, dans la section suivante, que les “forces de gravitation” font intervenir les 
dérivées premières de cet ensemble, par l'intermédiaire du tenseur de courbure. 

L'interprétation physique de l’équation des géodésiques (7.47) gagne en clarté 
lorsqu’on se place à l'approximation newtonienne : les vitesses considérées sont 
faibles devant la vitesse de la lumière, 


<c—; (7.49) 


et, de plus, le champ de gravitation est suffisamment peu intense pour que l’on 
puisse poser 


Jap oe Nap + hag ; (7.50) 


où hag n’est qu’une correction du premier ordre : 


lhogl 1 et  lhagl < lhagl - (7.51) 


La première condition, l’équation (7.49), entraîne que l’équation des géodési- 
ques se réduit à 


d'r” dx®\? 
ar + lo (=) AsO, (7.52) 


tandis que la seconde — la linéarisation des termes contenant le tenseur métrique — 
fournit 
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1 
Too ~ 57" Oy hoo, (7.53) 


où l’on a considéré le cas d’un champ de gravitation stationnaire, donc tel que 
a”) hag = 0, pour tout n. Dans ces conditions, l’équation des géodésiques se 
réduit a 


4 


2 
ef = 0 
ds? 
(7.54) 
dx : 
d2 oe — 3 Vhoo . 
Par identification avec l’équation newtonienne 
dx 
— = -V¢, 7.55 
de $ | (7.55) 
où ¢ est le potentiel de gravitation habituel, on en déduit 
hoo = 29, (7.56) 
et, finalement, 
goo = 1+ 2¢/c?. (7.57) 
Ainsi, pour une masse M située à l’origine des coordonnées, on aura 
GM 
= 1-2—. 7.58 
Joo Te ( ) 


Il est intéressant de remarquer qu’à l'approximation newtonienne, seul goo 
intervient; c’est ce qui explique que l’on puisse a priori considérer un champ 
scalaire pour décrire la gravitation relativiste [G. Nordström (1912)]. Toutefois, 
une telle généralisation relativiste de la gravitation prédit, par exemple, un retard 
du périhélie de Mercure et non une avance... 

Notons, enfin, le décalage spectral dans un champ de gravitation : l’équation 
(7.43) donne alors 


; 1/2 ns 
_ { Joo e) Si Pém — Pobs ; (7.59) 
goo (obs) 


po) 
nous retrouvons ainsi les résultats intuitifs du chapitre 4. 


La déviation géodésique 


Pas plus que le mouvement inertiel dans l’espace de Minkowski, le mouvement 
géodésique dans l’espace-temps courbe de la gravitation { V$, guv } n’est décelable 
par un observateur qui lui est intrinsèquement attaché : là encore, “le mouvement 
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est comme rien”. Aussi un observateur géodésique ne pourra-t-il mettre en 
évidence l’existence d’un champ de gravitation que par comparaison avec un 
mouvement voisin, par exemple géodésique. Précisons un peu cela. Dans l’espace de 
Minkowski, deux mouvements géodésiques [Fig. 7.10] sont définis par les relations 


zh(s) = us + z”(0) 
(7.60) 
y"(s') = wks’ + y#(0), 


xs) ys) 


x0) y 0) 


Figure 7.10. : La déviation géodésique dans l’espace de Minkowski. Cette déviation, £}, est une 
fonction linéaire du temps propre. Toute déviation à cette linéarité traduit l’existence d’une force. 


de sorte que la déviation £” (s) = z” (s) — y” (s) est une fonction linéaire du temps 
propre s ou, plus généralement, de tout paramètre affine a = as + b. Ainsi, toute 
déviation à cette linéarité traduit l’existence d’une force et donc le caractère non 
géodésique du mouvement de l’un ou l’autre — voire les deux — mouvement(s). 


Considérons maintenant le cas d’un espace-temps riemannien {V“, ga}, et 
soient deux géodésiques voisines décrites par x“(s) et x4(s) + z” (s), 6x" (s) 
étant la déviation géodésique (s est le temps propre ou tout autre paramètre affine). 
On a alors [Fig. 7.11] : 


a Sh (7.61) 


d? (xt + 6x") 
ds? 


d(x® + 62%) d(x + 6x) 
p : = 
+P (0+ a) = = 0. (7.62) 


Limitons—nous au cas de déviations faibles, ce qui nous permettra de négliger 
les termes supérieurs au second ordre (6x)*. En utilisant maintenant la forme 
précise des symboles de Christoffel I) ,, nous limitant au premier ordre en 6x° et 
soustrayant l’ équation (7.61) de l’équation (7.62), il vient 


(7.63) 
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xs) + &4s) 


xA(s) 
xs) 


Figure 7.11 : La déviation géodésique dans un espace-temps riemannien. 


qui est l’équation de la déviation géodésique. Cette équation exprime la déviation 
relative de deux particules en chute libre dans un champ de gravitation. La présence 
du tenseur de Riemann-Christoffel traduit évidemment l'influence de la gravitation 
et indique qu’en principe les “forces de gravitation” (c'est-à-dire Ras) sont 
mesurables dès lors que l’on mesure la déviation géodésique. Le fait que le tenseur 
Ruvag apparaisse dans l'expression de la “force de gravitation” — i.e. dans le 
second membre de l’équation (7.63) — indique bien que l’ensemble { Juv» DaN 
constitue plutôt des “potentiels de gravitation” : Ruvag s’obtient par dérivation de 
ces grandeurs. Dans le cas de l’espace de Minkowski, R,,48 = 0, et équation 
(7.63) se réduit à l’ équation des géodésiques et, de plus, on peut toujours trouver 
un système de coordonnées tel que T 8 =9; ôx” est alors une fonction linéaire du 
paramètre affine s : toute déviation à cette linéarité traduit l’existence d’un champ 
de gravitation via R,,48 et ce, naturellement, en l’absence d’autres forces qui 
pourraient aussi produire une telle déviation. 

Ajoutons enfin que c’est l équation de la déviation géodésique qui sera utilisée 
dans les calculs concernant les expériences sur les ondes gravitationnelles [Chap. 8]. 


Le tenseur métrique à symétrie sphérique 


Dans de nombreux problèmes concrets — système solaire, étoiles denses, 
cosmologie, etc. — on a affaire à des systèmes à symétrie sphérique. Cette invariance 
du système dans les rofations spatiales autour d’un point donné (le plus souvent 
pris comme origine des coordonnées spatiales) permet d’écrire le tenseur métrique 
sous une forme particulièrement simple dans un système de coordonnées adapté 
à cetté symétrie. Dans un tel système de coordonnées, les tenseurs d’espace (par 
rapport aux rotations) les plus généraux que l’on puisse écrire a priori sont 6°? et 
xx). Il s'ensuit que la métrique s’écrit nécessairement sous la forme 


(x.dx)? 


ds? = A(r,t)dt? — Br, jae — C(r,t)dx? — D(r,t) -2% (7.64) 
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où r est la distance à l’origine, où l’on a posé t = x° et où A,B,C et D sont 
des fonctions arbitraires de r et t, sans dimension. On a donc réduit de 10 à 4 le 
nombre de fonctions inconnues qui définissent le tenseur g,,,. On peut cependant 
éliminer encore deux des quatre fonctions A, B, C, D en exploitant l’invariance du 
ds? précédent dans les transformations de systèmes de coordonnées du type 


T° = fi (t',r’) qh 
(7.65) 
t = fe(t’,r’) 
où fı et fo sont des fonctions quelconques. Notons que ces transformations (7.65) 
préservent l’invariance par rotation, c’est-à-dire la forme (7.64) de la métrique. 
On trouve finalement (la démonstration est donnée plus loin) : 


t T (4 p 
t [ed 0 0 0 
r 0 erd) 0 0 
Japlr, t) = 9 0 0 a 0 , (7.66) 
p 0 0 0 —-r?sin? 0 


où v et À sont deux fonctions arbitraires de t et r, où l’on a utilisé les coordonnées 
polaires usuelles et où l’on a effectué le changement de variables t > tet r’ — r. 
Démonstration : 20 Commençons par montrer que le terme non diagonal dans la métrique (7.64), 


soit goi, peut être annulé. Pour cela, cherchons une transformation du type (7.65) qui le permette. 
Comme elle ne doit affecter que la variable ¢, nous la chercherons sous la forme 


T — TZ 
(7.67) 
t =A(t',r’). 
On a alors, en utilisant la loi de transformation du tenseur guv, 
Ioi = 24 [2 goo + oil , (7.68) 
de sorte que si l’on choisit À telle que 
Dee 3 
a = Boo! (7.69) 
on aura bien g}; =0. Cette dernière relation donne 
B= Bs (7.70) 


on peut donc toujours choisir B=0. 
Montrons maintenant qu’on peut trouver un changement de variables (de coordonnées) tel que C=1. 
Une transformation du type 
tat 
(7.71) 


at =k(r’ t’)a? 


20. Cf. J.L.Anderson (1967); voir aussi S. Mavridès (1973). 


Apercu du formalisme PPN 185 


est appropriée. Rapportée dans l'expression (7.64) du tenseur métrique, on obtient (pour la partie 
spatiale) 


Gi; = C(t,r).k? (r,t) 6:5 + terme en s.s” . (7.72) 


Choisissant maintenant k—C 1/2, on aboutit au résultat souhaité. Il est facile de vérifier — il est 
indispensable de le faire — que cette nouvelle transformation ne rétablit pas un terme du type go; ! 


Utilisant les coordonnées polaires habituelles, la forme (7.66) donnée pour le 
tenseur métrique est immédiate. Cette forme de gag s’appelle la forme standard 
et les coordonnées correspondantes, les coordonnées-standard, ou encore les 
coordonnées de Schwarzschild. Il en existe bien d’autres, résultant de l’utilisation 
d’autres systèmes de coordonnées. Par exemple, on peut obtenir la forme isotrope 
de la métrique à symétrie sphérique, c’est-à-dire 


ds? = E(r,t)dt? — G(r,t). [dr? + r?(d0? + sin? 6dg?)] . (7.73) 


Ce sont, principalement, ces deux formes que nous utiliserons dans la suite. Dans 
le cas d’une métrique qui, de plus, est statique (i.e. dans laquelle les différentes 
fonctions arbitraires précédentes ne dépendent pas de la coordonnée t), on passe 
de la forme standard à la forme isotrope, à l’aide de la transformation [voir, par 
exemple, S. Weinberg (1972)] 


r? B? ]\ dr 
em. [i45 [p+ 551} ae (7.74) 


Apercu du formalisme PPN 


Tout au long de ce chapitre, nous avons essentiellement donné des arguments 
en faveur d’un espace-temps courbe, énoncé le principe d’équivalence et indiqué 
aussi bien quelques-uns de ses fondements expérimentaux que certaines de ses 
implications théoriques. Cependant, il reste à préciser — c’est l’objet du prochain 
chapitre — à quelles équations de champ obéissent les potentiels de gravitation gv. 
Inutile de dire que ces équations, qui constituent un postulat supplémentaire, com- 
portent un grand arbitraire et ce, malgré diverses contraintes physiques [Chap. 8] 
que l’on doit imposer. 

L’un des procédés qui permettent de sélectionner, à partir des données expéri- 
mentales, des classes de théories acceptables parmi celles possibles, est constitué 
par le formalisme PPN (parametrized post-newtonian formalism) dont nous n’ex- 
poserons qu’ une version simplifiée due à H.P. Robertson (1962), L.I. Schiff (1962) 
et R. Eddington (1922); le formalisme général est détaillé dans l’ouvrage de C.M. 
Will (1981) et, également, dans celui de Ch. W. Misner, K.S. Thorne et J.A. Wheeler 
(1973). 
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De quoi s’agit—il et quelles sont les limitations du formalisme PPN? Il convient 
d’abord de remarquer que si la limite des vitesses faibles et des champs de 
gravitation peu intenses doit nécessairement conduire aux équations newtoniennes 
usuelles, les premiers effets non triviaux du caractère courbé de l’espace-temps 
doivent apparaître à l’ordre suivant (par exemple, en v?/c?), dit approximation 
post-newtonienne. C’est cette approximation — et éventuellement, les suivantes — 
que l’on va paramétrer pour tenir compte de l’infinie variété possible des équations 
que doivent satisfaire les composantes du tenseur métrique g,,,. Il est clair que ces 
effets pourront être mesurés dans des systèmes gravitationnels tel le système solaire 
(défiexion des rayons lumineux par le Soleil, avances du périhélie des planètes, etc.) 
pour lequel le paramètre gravitationnel est faible (GM/Rc? < 107$) mais pas dans 
le cas du pulsar binaire PSR 1913+16 qui émet des ondes gravitationnelles (pour 
lesquelles v = c, ce qui les exclut largement du formalisme PPN). 

Nous allons illustrer ce formalisme dans le cas simple d’un système à symétrie 
sphérique, tel le Soleil, et nous écrirons la métrique sous la forme isotrope (7.73). Si 
l’on identifie 2! la coordonnée radiale r à la distance usuelle, on se rend facilement 
compte que la seule grandeur non dimensionnelle que l’on puisse former dans ce 
contexte à partir de G, Mo, c et r est de la forme GM,,/re? = x. Comme r varie 
de 7 x 1019 cm (rayon du Soleil) à l'infini, la variable y est toujours inférieure à 
1076. Il est donc légitime ?? de chercher à développer les potentiels gravitationnels 
Goo et gi; [ou, si l’on préfère, les fonctions E(r) et G(r) de la métrique (7.73) 
supposée statique] en série entière de x, les g,,, étant sans dimension : 


2 
Ne ue + 28 GMs + -++| det? 
re? rc? 
= h = ne + | dx? , (7.75) 


où nous avons rétabli les facteurs c. Nous avons implicitement supposé que 
l’espace-temps est plat lorsqu’on se situe loin de la masse Mg qui courbe l’espace- 
temps : celui-ci est, asymptotiquement, un espace de Minkowski. Ceci explique 
pourquoi, dans le développement (7.75) de la métrique, celui-ci commence par 1. 
Notons encore que le paramètre x peut être interprété comme étant du type v?/c?, 
où v? est une vitesse caractéristique (e.g. la vitesse d’une planète sur son orbite); 
il s’agit donc bien d’un développement relativiste. Ainsi les différentes théories de 
la gravitation relativiste diffèrent les unes des autres par les valeurs des paramètres 
Q, B VW? 

Revenons au développement (7.75) et supposons que nous nous arrétions au 
premier ordre en x dans gi; : 


21. Cette identification ne va pas de soi (elle est d’ailleurs incorrecte) et nécessite une discussion délicate 
que nous omettrons. 
22. C’est une hypothèse faible physiquement, mais forte mathématiquement. 
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G2 
Ju ~ i- aya . (7.76) 


Pour que les deux termes de la métrique soient du même ordre, il est alors 
nécessaire de développer goo à l’ordre deux en x. En effet, comme 


dt? e 
22 _ 2 PRESS 2 
c‘dt = Cr x = ; (7.77) 
il est nécessaire que l’on ait 
pa 4 
ot 2077 + 285 (7.78) 
afin que 
vt v? 
Cd ~ =z dx’, l (7.79) 


en ordre de grandeur. 

On voit donc que, dans la plupart des applications pratiques, les résultats prévus 
par les différentes théories ne dépendront que des paramètres (a, 8, y) et non des 
formes précises des équations de champ. Finalement, les données d’ observation 
permettront d’ obtenir des limites sur les valeurs possibles de ces paramètres, et donc 
d’éliminer les théories qui prévoient des valeurs autres. Ainsi, la Relativité Générale 
d Einstein [Chap. 8] conduit à {a métrique suivante, la métrique de Schwarzschild : 


(1- Ge)" CMo\" 
ds? = ee = (1 + ra) . [dr? + r?d8? + r? sin? Ody? | 
(1 + oe) 


(7.80) 
et donc aa = 8 = y = 1, valeurs compatibles avec toutes les mesures actuelles. 
Ajoutons, pour terminer, que si l’on admet que la gravitation est correctement 
décrite par une théorie métrique, œ n’apparaît pas alors comme un véritable 
paramètre, car il peut toujours entrer dans la définition de la masse. En effet, 
approximation newtonienne de (7.80) donne 


MoG 
r2 


0 — ~@ ’ (7.81) 
qui n’est autre que la force gravitationnelle newtonienne. II s’ensuit que l’on peut 
toujours choisir a = 1 (définition de la masse Mo). 

Incidemment, le décalage spectral d’origine gravitationnel mesuré, par exemple 
dans l’expérience de Pound et Rebka, ne fournit aucune indication sur les paramètres 
p eta : il confirme simplement le caractère métrique des théories relativistes de la 
gravitation. 
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Les tests classiques 


Les tests classiques de la Relativité Générale sont au nombre de quatre : le 
décalage spectral vers le rouge, la courbure des rayons lumineux au voisinage 
des masses importantes, l’avance du périhélie des planètes et enfin le décalage 
temporel des signaux radar à l’intérieur du système solaire [LI Shapiro (1964, 
1968); LI. Shapiro et al. (1971)]. Dans le système solaire, la variable GM,./rc? 
est toujours très petite, de sorte que l’approximation post-newtonienne est tout à 
fait suffisante pour estimer ces effets. Aussi nous contenterons-nous de les évaluer 
dans le formalisme PPN présenté plus haut : ceci est évidemment valable pour 
toutes les théories métriques de la gravitation, comme la Relativité Générale, et 
permettra d’obtenir des estimations pour les paramètres PPN. Nous avons déjà 
discuté le décalage spectral vers le rouge, aussi nous limiterons—nous aux autres 
tests classiques. 

En outre, comme nous avons déjà discuté le décalage spectral vers le rouge 
d’origine gravitationnelle, nous nous limiterons ici au calcul de la déflexion 
des rayons lumineux au voisinage de masses importantes, reléguant en exercice 
F évaluation du retard des échos radar et renvoyant le lecteur à l’un des manuels cités 
pour ce qui concerne l’avance du périhélie des planètes [e.g. S. Weinberg (1972)]. 
Nous mentionnerons cependant les résultats obtenus en fonction des paramètres 
PPN et nous choisirons dans la suite a = 1, conformément aux remarques 
effectuées a la fin de la section précédente. 

1. Commençons par l’avance du périhélie des planètes. On peut alors, soit 
comme |’ avait fait Einstein, considérer les termes apportés par la relativité comme 
de petites perturbations aux équations classiques, soit résoudre l'équation des 
géodésiques correspondant à la métrique (7.75). On trouve ainsi 


2rGMo a 
ET ne (2— 8427), (7.82) 


où 6% est Yavance du périhélie, exprimée en radians par révolution, où e est 
l’excentricité de l’orbite planétaire et a la longueur de son demi-grand axe. 
S’agissant de Mercure 2%, la Relativité Générale (a = B = y = 1) prédit 
une avance de 43.03 secondes d’arc par siècle, très proche des 43.11 + .45 
observées. Cependant, un éventuel aplatissement du Soleil (donnant lieu à un 
moment quadrupolaire) peut également donner lieu à une avance du périhélie de 
Mercure [Ex. 9 du Chap. 1]. Ainsi, si la mesure de R.H. Dicke et H.M. Goldenberg 
(1967) (1974) [R.H. Dicke (1974)] selon laquelle le diamètre polaire du Soleil 
était plus faible que son diamètre équatorial d’environ (5.0 + .7) x 1075 et si cet 
aplatissement reflétait effectivement la répartition de la masse à l’intérieur alors, 
le moment quadrupolaire *4 résultant induirait une avance du périhélie de Mercure 
d'environ 3.4 secondes d’ arc par siècle, ce qui provoquerait un écart d’à peu près 8 % 


23. Pour Mercure, qui effectue 415 révolutions par siècle, l’excentricité de l’orbite est e=.2056 et son 
demi-grand axe a pour longueur a—57.91 x 10"! cm. 
24. Voir la discussion de S. Weinberg (1972) et C.M. Will (1981). 
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entre la Relativité Générale et l’observation. Ajoutons enfin que l’interférométrie 
à grande base permet l’obtention de la déflexion de signaux radio émis par divers 
objets astrophysiques et fournit y = 1.0002 + 0.002 [D.S. Robertson et al. (1991)]. 

2. Venons-en maintenant au retard d’échos radar renvoyés par des planètes. 
Lorsqu’on envoie, depuis la Terre, un signal radar sur une planète donnée, celui-ci 
ne se propage pas en ligne droite - comme dans un espace euclidien ~ mais dans un 
espace courbe, correspondant aux sections spatiales de l’espace-temps [Fig. 7.12] 
de métrique 


Se) [dr? + r2d6? + 7? sin? 0dy?]. (7.83) 


trajectoire approchée 


Terre 


| T Soleil 


Figure 7.12 : Géométrie du système Terre-Soleil-Planète-Faisceau radar, dans le plan de 
l’écliptique, lorsque la Terre, le Soleil et la Planète sont en conjonction supérieure. En pointillés, 
la trajectoire du faisceau radar si l'espace était euclidien. La courbure du faisceau a été fortement 
exagérée et peut, en fait, être assimilée à deux segments de droite. 


Dans le système de coordonnées PPN considéré, l'intervalle de temps- 
coordonnée At entre l émission du signal et sa réception sur Terre, après réflexion 
sur une planète donnée, est fourni par la relation 


z (7.84) 
où zy est la distance Terre—Soleil, où x p est la distance Planète—Soleil et où b est le 
paramètre d’impact du faisceau radar : en pratique, b} Ro; l effet le plus marqué a 
lieu lors de la conjonction supérieure Planète-Soleil-Terre. Notons que b/xr < 1 
et b/xp < 1. En fait, ce n’est pas At qui constitue la grandeur observable mais 
plutôt l'intervalle de temps propre correspondant, Ar, pour l observateur terrestre 
(Ar? = ds? = goodt? — 0), c’est-à-dire 


4 
5 At ~ opt apt (14+7)GMoln ( zae) , 


GMo 


Ar = (\/900) terre At = € — 2 VE At. (7.85) 
dr 
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La relation (7.84) correspond uniquement au cas de la figure 7.12; le cas général 
peut étre trouvé dans S. Weinberg (1972). Le premier terme de cette relation est 
le terme habituel correspondant à l’aller et retour du signal radar à la vitesse de la 
lumière c = 1, tandis que le second constitue l’effet relativiste proprement dit, dû 
à la courbure de l’espace au voisinage du Soleil. 

La relation (7.84) peut être obtenue 25 en remarquant qu’un photon, un rayon lumineux ou une 


impulsion radar se propage selon une géodésique de longueur nulle ds? =0; c’est-à-dire, en utilisant 
la métrique PPN (7.75), 


(2 — zemo) dt? ~ (: +27 spo) [ar?2+ r? dy?) ; (7.86) 


Pour obtenir At, il suffit alors d'intégrer dt : dr et dọ sont transformés en éléments d'intégration 
en dz en notant que 


raf 22+ y? ; cosy = y : (7.87) 
En outre, comme le faisceau radar est très peu courbé, y#b. Avec 
d 
MY a dak, (7.88) 
il vient alors 
a _GMo_ 7. 
dt (2 + (1+7) te) dz . (7.89) 


Intégrant maintenant cette relation entre xp et x7 et ne conservant que les termes de plus bas ordre 
en b/xr et b/xp, la relation (7.84) s’obtient immédiatement. 


Pour une réflexion radar sur Mercure — la durée du trajet est d’environ 20 
minutes — le retard attendu, dans le cas de la Relativité Générale, pour laquelle 
y = 1, est de l’ordre de 240 us, et est donc tout à fait mesurable. L’expérience 
est, cependant, non seulement délicate 4 mettre en ceuvre (en particulier, compte 
tenu de la faiblesse de l’écho) mais encore extrêmement complexe *° à analyser 
tant les corrections théoriques et les sources d’erreur sont nombreuses et difficiles 
à évaluer. Notons encore que le mouvement de la Terre doit être pris en compte : 
en effet, l’orbite terrestre étant quasiment circulaire, ce qui donne v? ~ GMọo/r, 
et le facteur de dilatation des durées 4/1 — v? donne alors lieu à un facteur 3/2, 
au lieu de 2 dans la correction (7.85). Ainsi, dans les relations (7.84) et (7.85), les 
grandeurs zr, Xp et b ne sont pas suffisamment déterminées (environ 1.5 km, pour 
obtenir une précision de 10 us sur Ar). De même, la réflexion du faisceau radar sur 
Mercure, ou sur toute autre planète, s’effectue sur une surface notable 27 (et non 
en un point), ce qui induit une dispersion dans le temps d’arrivée de l’écho radar. 
Une autre difficulté provient du fait que la couronne solaire est un milieu dispersif 
dont les caractéristiques varient beaucoup au cours du temps. Ces quelques éléments 


25. Voir M.G. Bowler (1976) ou N. Straumann (1984). 

26. Un aperçu simple est donné dans S. Weinberg (1972). Voir également la discussion théorique de 
LE Shapiro (1966), D.K. Ross et L.I. Schiff (1966). 

27. Les propriétés réflectrices de la surface de Mercure sont déterminées, expérimentalement, lorsque 
Mercure, le Soleil et la Terre sont en conjonction inférieure, ce qui permet d'éliminer le retard dû à la 
gravitation relativiste. 
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indiquent, à l’évidence, la difficulté et la complexité de ce type d’ expérience, de son 
substrat théorique et de son analyse afin d’en extraire des résultats physiquement 
significatifs. 

L'expérience a été effectuée sur Mercure et Vénus [Fig. 7.13] [LL Shapiro 
(1968); LI. Shapiro et al. (1971)] puis sur les satellites Mariner VI et VII qui 
présentent l’avantage d’éviter les problèmes liés à la topographie des surfaces de 
planètes mais ont l’inconvénient d’être très sensibles à toutes sortes de perturbations 
non gravitationnelles, comme le vent solaire et la pression de radiation [J.D. Ander- 
son ef al. (1975)]. De même, la mission Viking a permis de déposer sur Mars deux 
“transpondeurs” (le signal émis à une fréquence donnée est réfléchi à une autre 
fréquence, ce qui permet d’éliminer les effets de la réflexion d’une large zone de la 
planète) qui ont permis d’améliorer substantiellement les résultats [R.D. Reasen- 
berg et al. (1979)]. Une nouvelle analyse des données [R. Hellings et al. (1983)] a 
finalement donné 


y = 1-(.7 1.7) x 107%, ` (7.90) 


ainsi qu’une valeur 2° pour le paramètre 8 


B = 1 — (29 + 3.1) x 10%, (7.91) 


confirmant les valeurs obtenues par la Relativité Générale [Chap. 8]; toutefois, 
il semble que ces chiffres soient assez optimistes. Aussi nous limiterons-nous 
prudemment aux valeurs données par R.D. Reasenberg et al. (1979), c’est-à-dire 
~y = 1.0002 + 0.002. 


3. Le dernier test classique (le premier, historiquement) concerne la déflexion 
des rayons lumineux au voisinage du Soleil. Cet effet, mesuré pour la première 
fois lors de l’éclipse de 1919, devait assurer le triomphe de la Relativité Générale. 
Concernant l’astrophysique, cet effet est particulièrement intéressant car il donne 
lieu aux mirages gravitationnels [voir section suivante}, bien observés aujourd’hui, 
et dont on espère extraire un certain nombre de données sur les galaxies ou la 
cosmologie. 

La trajectoire d’un rayon lumineux dans un champ de gravitation peut être 
obtenue soit à partir de l?’ équation des géodésiques, soit à partir du fait que, le long 
du rayon, ds? = 0. Nous utiliserons cette dernière relation qui, jointe à la métrique 
(7.75), donne 


dr 
Cette relation montre que tout se passe comme si la vitesse de la lumière n’était pas 
constante dans un champ de gravitation. Celui-ci induit un indice de réfraction 


2 
M =i+(i+r) 2e + 0 [He (79) 


28. Dans la relation simple (7.84) seul le paramètre y apparaît. Néanmoins, bien d’autres paramètres 
interviennent dans une analyse approfondie des résultats expérimentaux et, notamment, £. 
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Figure 7.13 : Résultats des expériences de réflexion radar sur Vénus {d'après LI. Shapiro et al. 
(1971)]. 


c 1 
Aussi le principe de Fermat 
6 fnt) dé = 0 (7.94) 


(dé est l'élément de longueur euclidienne le long du rayon lumineux) permet-il de 
déterminer le chemin optique de la lumière, en utilisant les équations de Lagrange 
[Appendice C] correspondant à (7.94), c’est-à-dire 


d d 
Z (nt) =) = Vn(r). (7.95) 
[M. Born et E. Wolf (1975)]. La variation angulaire cherchée pour le rayon lumineux 
n’est autre que la différence entre les directions des asymptotes, c’est-à-dire 


"e2 (7.96) 
-+00 
(e2 est un vecteur unitaire porté par Oy). 
Si l’on intègre l’équation (7.95) le long de la trajectoire non perturbée y = b, on 
ne commet guère qu’une erreur du second ordre; si, de plus, on tient compte de ce 
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qu’à l'infini où la métrique (7.75) est minkowskienne, n(r) = 1, alors on obtient 
[Fig. 7.14] successivement 


s= dx dx 
=e dé +00 7 dé —00 
= fee e2: Vn(r) dé (7.97) 
+00 d : | 
à $ gn) ae (7.98) 
ne ING aa 2\1/2 b 


Figure 7.14 : Déviation des rayons lumineux. 


En insérant maintenant l’expression (7.93) de n(r) dans cette dernière équation, il 
vient, tous calculs faits : 


6 = (1+7y)2 ee (7.100) 
Pour b = Ro, la déviation est 
= 0 1.75". 


La Relativité Générale prédit ainsi une déviation de 1.75” des rayons lumineux 
frôlant le Soleil. 

La déduction précédente repose sur l’utilisation du théorème de Fermat en 
Relativité Générale. Celui-ci pourrait, cependant, ne pas être valable; en fait, il peut 
être démontré simplement [voir, par exemple, M.A. Tonnelat (1964); N. Straumann 
(1984); etc.]; il s’écrit sous la forme 
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sfa = 0, (7.101) 


et n’est vrai que pour les champs statiques. 

On trouvera, par ailleurs, une démonstration de la relation (7.100) invariante dans 
les changements de coordonnées à l’approximation PPN dans C.M. Will (1981) 
[voir également les remarques de S. Weinberg (1972)]. 


Il reste un dernier point à éclaircir : pourquoi le calcul approximatif effectué dans le cadre de la 
Relativité Restreinte, au chapitre 4, fournit-il la moitié du résultat donné par la Relativité Générale? 
Citons C.M. Will (1981), très clair dans l’explication physique de cette “anomalie” : ces calculs 
“sont corrects . . . Mais leur résultat est une déflexion de la lumière relativement à des lignes droites 
locales, définies, par exemple, par des règles rigides; cependant, en raison de la courbure spatiale 
autour du Soleil, courbure déterminée par le paramètre PPN y, les lignes droites locales sont 
elles-mêmes courbées par rapport aux lignes droites asymptotiques, i.e. loin du Soleil, exactement 
de manière à donner le facteur 7/2 restant. Le premier facteur 1/2 est valable dans toute théorie 
métrique tandis que le second y /2 varie d'une théorie à l’autre. Il s'ensuit que les calculs qui tendent 

à déduire la déflexion (complète) de la lumière sur la seule base du principe d'équivalence sont 

incorrects [voir L.I. Schiff (1960) et la critique de W. Rindler (1968)].” 

Venons-en maintenant à |’ observation de cet effet, mesuré pour la première fois 
en 1919 par FW. Dyson, A.S. Eddington et C. Davidson, et à maintes reprises 
depuis. La mesure consiste, essentiellement, à comparer la photographie d’ étoiles, 
au voisinage du Soleil lors d’une éclipse totale, à la photographie de la même région 
du ciel à une autre période de l’année — par exemple, six mois avant — et à évaluer, 
après de nombreuses et délicates corrections, les diverses déviations. Les dernières 
mesures ont été effectuées en Mauritanie et au Texas en 1973. La figure 7.15 fournit 
un résumé de quelques mesures réalisées 79. 

Parmi les sources d’erreur difficilement réductibles, l’atmosphère solaire joue un 
rôle important; aussi a-t-on pensé à effectuer des mesures de déflexion de la lumière 
frôlant Jupiter, qui ne présente pas ce genre d’inconvénient. Pour y = 1 (cas de la 
Relativité Générale), la déviation est d’environ 0.02”, ce qui est trop faible pour 
pouvoir être mesuré sur Terre; par contre, le satellite astrométrique Hipparcos — s’il 
fonctionne correctement — devrait pouvoir permettre une telle mesure puisqu’en 
principe, il devrait étre capable de déterminer les positions d’étoiles avec une 
précision de 2. x 107° secondes d’arc ... 

Cependant, les progrés des techniques interférométriques 4 grande base, dans 
le domaine radio, devraient permettre d’atteindre une précision de quelques 1074 
secondes d’arc. L'expérience a été effectuée dès 1969 [D.O. Muhleman et al. (1970)} 
et fournit actuellement les valeurs les plus précises du paramètre y données par les 
mesures de déflexion de la lumière 3° : chaque année, les quasars 3C273, 3C279 
et 3C48 (qui sont de très puissantes radio-sources) passent très près du Soleil; du 
moins, vus depuis la Terre. 

Plus encore que la lumière visible, les ondes radio sont sensibles à la dispersion 
due à la couronne solaire (et aussi à l’ionosphère terrestre) qui induit également 
une déflexion dont il est nécessaire de tenir compte. 


29. On trouvera une liste des diverses mesures effectuées dans L. Bertotti et al. (1962). 
30. Voir la revue de E.B. Fomalont et R.A. Sramek (1977). 
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Figure 7.15 : Résultats des mesures de déflexion de la lumière au voisinage du Soleil {d’après 
E.F. Freundlich (1960); reproduit avec l’aimable autorisation de l’éditeur]. 


Les mirages gravitationnels! 


Les mirages gravitationnels *?, dont le premier a été observé par D. Walsh, 
R. Carswell et R. Weymann en 1979, ont une longue histoire qui débute avec l’idée 
de la défiexion de la lumière par les masses importantes en Relativité Générale. I 
semble bien que l’idée de “lentille gravitationnelle” [Fig. 7.16] soit due à O. Lodge 
(1919) et que le premier calcul ait été réalisé par A. Einstein (1936) sur la base 
d’une suggestion de R.W. Mandl (1935). Par la suite, un grand nombre de calculs 
et de développements divers devaient étre effectués. 

Les mirages gravitationnels sont basés sur les propriétés trés particuliéres des 
lentilles gravitationnelles qui autorisent la formation d’ images multiples d’un même 
objet ponctuel. Mais il ne s’agit pas là du seul effet possible. D’une part, ces 
images manifestent une amplification de la luminosité apparente de la source et, 
d’ autre part, les signaux observés dans les diverses images présentent un décalage 
temporel, caractéristique de la source, du déflecteur et des distances relatives de ces 
derniers et de l’observateur. Le principal intérêt des mirages gravitationnels — outre 
la confirmation de la Gravitation Relativiste d’Einstein — est qu’ils permettent, 
en principe, de déterminer les paramètres cosmologiques liés à l’expansion de 
l'Univers (constante de Hubble Ho) et à sa courbure spatiale (paramètre de 
décélération qo) [S. Refsdal (1964) (1966)]. Nous allons examiner ces diverses 


31. Cette expression a été introduite par J. Schneider. On parle également de “lentilles gravitationnelles”. 
32. On trouvera un bref historique dans J.M. Barnothy (1989). Voir également S. Liebes (1964), 
C. Vanderriest (1984) (1986) et P. Schneider (1992). On consultera aussi F. Link (1969). 
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Figure 7.16 : Lentille gravitationnelle. Contrairement à une lentille optique ordinaire pour laquelle 
les rayons lumineux provenant de l'infini se concentrent au foyer, la lentille gravitationnelle ne possède 
pas de distance focale : les rayons lumineux provenant, parallèlement, de l'infini se concentrent sur une 
demi-droite. En outre, la lentille gravitationnelle est parfaitement achromatique. 


propriétés dans le cas simple d’une source S ponctuelle et d’un déflecteur D, 
ponctuel également [Fig. 7.17], l extension à des sources et des déflecteurs étendus 
ne présentant pas de complications autre que de calcul. Notons, à cet égard, qu’une 
“optique géométrique” gravitationnelle * peut toujours être édifiée à partir du 
“principe de Fermat” indiqué précédemment. 


lop Ips 


Figure 7.17 : Géométrie de la déflexion de la lumière émise par la source S, par le déflecteur D, et 
observée en O. b est le paramètre d'impact, lon et pg sont les distances relatives observateur/déflec- 
teur et déflecteur/source, respectivement. Les grandeurs observables, en principe, sont Lop,lps et 
y=Pota. Notons que tous les angles indiqués sont, dans la pratique, extrêmement petits : la courbe 
pointillée est la trajectoire réelle d'un photon émis par la source et diffère très peu du trajet SPO. 
8(b) est la déviation du rayon lumineux; Sı est l’image de S vue par O. Remarquons que S n’est pas 
directement observable. 


33. L’approximation de l’optique géométrique est évidemment valable ici, les distances mises en jeu étant 
toujours nettement plus importantes que les longueurs d’onde considérées (y compris les dimensions 
du déflecteur et de la source). 
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1. Commençons par écrire à quelle condition l’observateur © pourra voir des 
images multiples de S et, à cette fin, écrivons qu’un rayon lumineux atteint O après 
déflexion par D, de masse M. Le triangle OPS nous donne la relation 34 


O(b) = à + B = +. (7.102) 


Tous les angles considérés étant très petits °°, leurs sinus et tangente leur sont 
assimilables et l’on a 


TO ay a ES 


; =6B , PQ=PD-QD, QD=£opfo; (7.103) 
lop lps 


la relation (7.102) donne alors 


4GM 
b 


qui se traduit par le diagramme de la figure 7.18. 


= (b- ofon) G + a) , (7.104) 


lop {ps 


Figure 7.18 : Condition pour qu’un rayon lumineux issu de S soit observé. Dans le cas d’une source 
et d’un déflecteur ponctuels, il y a toujours deux solutions, donc deux images de la source. 


Cette figure indique, dans le cas d’une source et d’un déflecteur ponctuels, 
qu’il existe toujours deux images de la source, de part et d’autre de l’axe 
source/observateur [une solution de l’équation (7.104) est positive et l’autre 
négative], l’une proche et l’autre éloignée. Lorsque la source, le déflecteur et 
l’observateur sont alignés, les deux solutions sont égales et de signes opposés; 
c’est pourquoi la symétrie du problème, par rapport à cet axe, fait que l’image 
de la source est un anneau, l’anneau de Chwolson/Einstein [O. Chwolson (1924), 
A. Einstein (1936)]. 


34. Nous nous placerons dans le cas de la Relativité Générale, pour laquelle y=1 et donc 2.(1+)=4. 
35. Au plus de l’ordre de quelques secondes d’arc. 
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De maniére générale, la source n’est jamais directement observable et seules le 
sont ses images. Les autres grandeurs accessibles à |’ observation sont : la position 
dans le ciel et la distance du déflecteur, la distance de la source et les écarts angulaires 
Pi = a; + Bo (i = 1, 2) entre le déflecteur et les images S;. Compte tenu de ce que 


bi = (ai + Po) fon = Yilon (7.105) 
la relation (7.104) fournit 
4GM 
$12 = 5 — eps, (7.106) 
Loptos 


qui permet, théoriquement, d’ évaluer la masse du déflecteur en termes des grandeurs 
observables. On trouverait également une autre relation donnant l’angle 8o, c’est- 
à-dire la position angulaire de la source. 


Dans la pratique, les seuls objets quasi ponctuels que l’on connaisse sont 
les quasars et les seules masses déflectrices susceptibles de donner des effets 
observables sont des galaxies [F. Zwicky (1937)]. Cependant, les uns et les autres 
sont des objets cosmologiques dont la distance n’est connue qu’au travers de la loi 
de Hubbie 


He (7.107) 
où Ho est une constante qui vaut entre 50 et 100 kilomètres par seconde et par 


mégaparsec % et où z est le décalage spectral. Aussi, en termes de grandeurs 
observables, la relation (7.106), par exemple, s’écrit-elle alors 


Pipes = Ho(zs HDI zp) ; (7.108) 
ZD: 2S 


où zg et zp sont les décalages spectraux de la source et de la galaxie déflectrice, 
respectivement. Cette dernière relation permet donc — si la masse M est connue — 
de déterminer la constante de Hubble Ho. En fait, zg mest accessible que parce 
que les images S et Sz possèdent le même décalage spectral : 


2S, = ZS, = ŽS; (7.109) 
cette dernière propriété permet, évidemment, de rechercher des candidats mirages 
gravitationnels. 


En réalité, la situation est encore un peu plus compliquée car la loi de Hubble 
sous la forme (7.107) ne s'applique qu’à des distances proches et doit, en fait, 
être corrigée par la courbure spatiale de l’ Univers, laquelle introduit un nouveau 
paramètre inconnu, qo, le facteur de décélération. 


Bien plus, la galaxie déflectrice n’est aucunement ponctuelle et la déflection de 
la lumière à la distance b est de la forme 


36. 1 Pc = 3.26 années-lumière. 
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4GM (b 
8(b) = e, (7.110) 
où M(b) est la masse contenue dans une sphère de rayon b. Il s'ensuit que 
la condition (7.104) est modifiée et, par conséquent, la figure 7.18. Pour une 
galaxie elliptique, la densité de masse est souvent approçhée par la fonction 
[G. de Vaucouleurs (1948)] 


p(b) = po eT, (7.111) 


ou une fonction en b!/4, etc. Dans ce cas, au lieu de l’hyperbole équilatère de la 
figure (7.18), on a une courbe plus compliquée (Fig. 7.19] et l’on a alors la possibilité 
d’avoir une ou trois images (éventuellement dégénérées). Plus généralement, 
on peut obtenir un grand nombre d’images mais toujours en nombre impair 
[W.L. Burke (1981)]. 


Figure 7.19 : La courbe 6(b)—6 dans le cas d’un déflecteur étendu (de densité de masse ~b1/*), 
On a maintenant affaire à une ou trois images, éventuellement dégénérées. 


Quelles formes peuvent avoir les mirages gravitationnels? Un cas simple 
[S. Liebes (1964)] est illustré sur la figure 7.20 où l’on a indiqué les diverses 
possibilités compte tenu des positions relatives de la source et du déflecteur. Pour 
des galaxies déflectrices de forme plus complexe, on peut obtenir une grande variété 
d'images possibles, étudiées dans la littérature. 


Figure 7.20 : Forme des mirages gravitationnels dans le cas de deux images S; et Sz pour diverses 
positions relatives de la source et du déflecteur, Le point noir représente la lentille. Le cercle pointillé 
représente l'étoile occultée vue de l'étoile occultante. Le cercle en trait continu représente l'étoile 
occultée vue de la Terre, en l'absence de lentille [d’après F. Link (1969) Fig. 7.9; reproduit avec 
l’aimable autorisation de l'éditeur, © Springer-Verlag]. 
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2. Le second effet qui intervient dans les mirages gravitationnels, et qui permet 
d’assurer que deux (ou plusieurs) objets de méme décalage spectral constituent 
bien un mirage, est le décalage temporel entre les signaux provenant de diverses 
images. 

Cet effet est dû à ce que, d’une part, les rayons lumineux provenant (en 
apparence) des diverses images parcourent des trajets optiques différents (S PO 
et SP20, où 1 et 2 désignent les deux trajets; [cf. Fig. 7.17]) et, d'autre part, les 
champs gravitationnels subis le long de ces trajets sont différents. 

Pour l’évaluer, il suffit de partir du fait qu’un photon parcourt une géodésique 
isotrope ds? = 0, et donc que 


[1 — 2G¢(r)|dt? — [1—2Gp(r)]-! dx? = 0 (7.112) 
[d(r) est le potentiel newtonien ordinaire de la galaxie déflectrice], qui donne 


dt ~ [1 —2G¢(r)|de, (7.113) 
et, finalement, 
AT = dt (7.114) 
A(trajet) 
= dl — 2G i o(r) de. (7.115) 
A(trajet) A(trajet) 


Le premier terme du membre de droite de cette relation est la différence des 
chemins optiques, tandis que le second refléte le fait que la géométrie spatiale de la 
zone parcourue par les photons n’est pas euclidienne. Bien entendu, le potentiel ¢(r) 
dépend de la répartition de la masse de la galaxie déflectrice et, éventuellement, 
d’autres masses présentes à proximité des rayons lumineux. Ce premier terme 
s’évalue sans difficulté : 


AT, = SP, + P10 — SP — PO 


# a (y1 + p2)(p1 — p2 — 20) , (7.116) 
et, typiquement, est de l’ordre de l’année. Le second terme nécessite la donnée de 
la répartition des masses dans le déflecteur; toutefois, pour une masse concentrée 
en un point, le calcul est exactement le même — le phénomène physique sous-jacent 
étant identique — que dans le cas du retard des échos radar dans le système solaire. 
On trouve ainsi 3” 


37. En fait, dans le cadre de la cosmologie, le terme AT} doit être corrigé par un facteur (1+zp) et 
aussi par d’ autres termes. 
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AT, = 4GM tn = 4GM en È. 
by pı 


Les deux contributions, A7} et AT», sont du même ordre de grandeur, ainsi que 
Font noté J.H. Cooke et R. Kantowski (1975). 

3. Le troisième effet — l’amplification de l’intensité des images — permet 
d'obtenir des données supplémentaires sur le système source-déflecteur et son 
environnement cosmologique. Il résulte de la conservation du nombre de photons, 
ou encore, de la conservation du flux lumineux. On peut, en effet, montrer [voir, par 
exemple, R.K. Sachs (1961)] qu’étant donné un faisceau de géodésiques isotropes 
issues d’un point donné, et si l’on appelle dX une *® 2-surface orthogonale au 
3-vecteur d’onde, alors la grandeur 3° [dE (où J est l’intensité à l’endroit où l’on 
se place dans le faisceau) vérifie 


(7.117) 


Id5|, = IdZ:|, = const. (7.118) 


et est indépendante de la vitesse de l’observateur. Il s’ensuit que le rapport des 
luminosités est donné par 

Li dd, 

I o (7.119) 

Pour calculer l’amplification de la lumière, dans le cas d’une lentille gravita- 

tionnelle, nous utiliserons la méthode de S. Refsdal (1964) sous la forme donnée 
par E.E. Clark (1972). Considérons donc un pinceau lumineux émis par » dans 
Tangle solide dQ; il découpe une aire dp dans le plan IIp orthogonal à Paxe 
source—observateur à la distance fop [Fig. 7.21] et contenant, par conséquent, le 
déflecteur. Si le déflecteur était absent, ce pinceau lumineux découperait dans le 
plan-image Ho une surface élémentaire dX, et l’on aurait 


do _ o dos) a 


12 
dS'p Lsp 20 


En réalité, le pinceau lumineux est défléchi et, dans le plan Ho, il découpe une aire 
élémentaire dX, correspondant à l’image Sı (non indiquée sur la figure 7.21) de 
la source S. Il existe, bien entendu, une configuration analogue pour l’autre image 
de la source. Notons qu’en raison de la symétrie du problème, dxo = dxp = dx. 
On aura ainsi 


dZp 


b db dx (7.121) 


dE, = rdrdx (7.122) 


38. Cela dépend du choix de l’axe temporel. 
39. 1=A?, où A est l amplitude électromagnétique. 
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plan de 
l'observateur 


plan du 


déflecteur A, 


Figure 7.21 : Géométrie de l’amplification des images. {d’aprés E.E. Clark (1972)]. 


r est défini parr = Bon lop ; r est alors donné par l’équation de la lentille (7.104), 
qui s’écrit encore 


r = nb — lop A(b). (7.123) 
Dans ces conditions, 
dx), r dr 
= = — 7.124 
dsp b db’ ( ) 
et, compte tenu de la relation (7.120), on obtient l’amplification de l’image L4 /Lo : 
Lı d&s ab ary. 
Lo d, °” r (j) ’ MS) 


qui s’écrit, en différenciant l’équation (7.123) 


L 2b 1 
Tr 


= (7.126) 


Naturellement, il existe une relation analogue pour l’image S2 et, en utilisant 
les données géométriques de la figure 7.17, il vient [pour le détail du calcul, voir 
S. Refsdal (1964)] : 


Lı =1(2+$42) 2 

z “à (7.127) 
lh =i -2+ $42) o, 
2 à ( Bo Y 0 


(où y est la séparation angulaire des deux images) de sorte que la luminosité totale 
Liot = Li + Le est donnée par 


Lioi = 3 (£ + à) Lo, (7.128) 
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la différence des luminosités des deux images étant égale à Lo. De même, le rapport 
des luminosités des deux images est donné par 


L 2 
E = | (7.129) 
2 


Lorsque la source, le déflecteur et l’observateur sont très bien alignés, i.e. lorsque 
Bo ~ 0, Ltot. peut prendre des valeurs très importantes. 

4. Ce qui précède est tout à fait élémentaire et les situations réelles sont 
beaucoup plus compliquées : source et déflecteurs étendus donnant lieu à des images 
multiples et de formes complexes; déflecteurs transparents ou non, possédant 
ou non des symétries, etc. Notons aussi que ces considérations s’appliquent 
également aux ondes gravitationnelles |Chap. 8]. En outre, toutes sortes d’études 
de cosmologie utilisent les (ou tiennent compte des) propriétés des lentilles ou 
mirages gravitationnels. Aussi existe-t-il à l’heure actuelle une littérature tout à 
fait abondante (plusieurs centaines d’ articles!) sur le sujet, dont un nombre croissant 
consacrés à des observations ou à des problèmes observationnels. 


EXERCICES 


1. A partir des équations des géodésiques (7.61) et (7.62) pour deux mouvements voisins, démontrer 
l’équation de la déviation géodésique (7.63). 


2. Vérifier que la métrique la plus générale à symétrie sphérique écrite sous la forme (7.64) s'obtient 
effectivement à partir des seuls tenseurs spatiaux disponibles 6°’ et x°x°?. 


3. (i) Montrer que la métrique PPN, donnée plus haut sous forme isotrope (7.75), en coordonnées 
standard s’écrit sous la forme 


2 2 
ds? l 2a GM 4x ay) GPL +]? 


— [1 + 2 M + se] dr? — r? (ae? + sin? de’). 


(ii) Calculer alors les symboles de Christoffel correspondants et écrire les équations des géodési- 
ques. 


Gii) Calculer le tenseur de Riemann à l'approximation considérée puis celui d’ Einstein. 


4. En Relativité Restreinte, le lagrangien d’un champ scalaire w est donné par 


L=} {(¥)?-V(4)} , 


où V (4) est une fonction donnée de w. 
(i) Ecrire les équations du mouvement. 


(ii) Comment s’écrivent-elles en présence d’un champ de gravitation si est couplé “minimale- 
ment” a la gravitation? 


(iii) Donner un exemple simple de couplage non minimal. 


5. Soit la métrique 


ds? = (1+2¢)dt? — (1-26)dr? , 


204 Le principe d’équivalence 


définie sur V*. ¢ est une fonction telle que }¢}<1. Ecrire l’équation des géodésiques. Calculer les 
composantes du tenseur de Riemann R,vag.- 


6. Vérifier que l’équation de Maxwell V,, F”” =4r J” implique la conservation du quadricourant : 
VJ" =0. 


7. On considère |’équation satisfaite par le 4-potentiel A” dans l’espace de Minkowski 
CJA“ — 8, “AY = 4r" . 
Les équations suivantes 
{ VAVY AH — Va VH A = 4 JP 
VaV* AE — Va VË A` — RË YAS =4rJ" 

en sont-elles des généralisations dans {V*,g,,,,}? Peut-on les obtenir à partir de la règle de couplage 
minimal? Qu’en est-il de l invariance de jauge? 

8. On considère l’équation 

VusJt=aR, 


où À est une constante et R le scalaire de Ricci. J est un quadricourant de particules. 


(i) A quelle équation l’équation précédente se réduit—elle en l’absence de gravitation? En est-elle 
la généralisation que fournirait le “couplage minimal”? 


(ii) Peut-on, sur la base d’arguments physiques, affirmer que A=0? 
9. Démontrer le théorème de la note 14. 


10. A partir de la relation (7.82) qui fournit l’avance du périhélie d’une planète (par révolution), 
trouver un encadrement pour le paramètre PPN y, en se reportant aux données d’observations fournies 
au chapitre 1. 


11. On se propose de calculer, au premier ordre des perturbations, l’avance du périhélie d’une 
planète, dont la trajectoire non perturbée obéit à l'équation de la dynamique 


ae ems... (1) 


T 


Première partie : 
(i) Montrer que 


tip = en (2) 
et que 
GmM, 
de = Sato dg 8 
où 


J=mr? de á (4) 
(ii) En déduire que l’on a l'intégrale première 


v= GmMo (ee +e). (5) 


où e est un vecteur constant. 
(iii) Vérifier que 


e= Gating ^P - Gm? Moer| (6) 
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où k est est le vecteur unitaire orthogonal au plan du mouvement. 


(iv) On se propose maintenant de montrer que |e] est l’excentricité de l’ellipse et que sa direction 
est celle de son petit axe. On appellera y l'angle entre e, et r. En considérant le produit scalaire mr.v 
et en utilisant l’équation d’une ellipse en coordonnées polaires (r,@), 


_ a(1-e?) 
T= T+ecos6’ (7) 
vérifier les résultats indiqués et que p=0+7/2. 


Deuxième partie : On se propose maintenant de calculer l’avance du périhélie de la planète, soit p, due 
à la force perturbatrice, centrale, 


F= ens g(r)er . (8) 
(i) Montrer que 
ge =- ap g(r)er , (9) 
et en déduire que 
de ___dr J? g(r) 
edt = et Gm? Mor? ` (10) 


(ii) Montrer que ia grandeur 


12 $ J? g(r’) $ 
5€ + f Om Mor?” (1 1) 
est conservée, 
Gii) Montrer que 
end? = ep, (12) 
et déduire de (9) que 
dy Jz g(r) de (13) 


[etme] SP 4 


(iv) Par intégration de cette derniére relation, puis en considérant uniquement le premier ordre des 
perturbations, montrer que l’avance Aw du périhélie d’une planète sur une révolution est donnée par 


Ap ~2 [7 gfr(8)] cos 6d0. (14) 


o 


(v) Application : g(r)=3J? /m?c?r?. [Réf. : B. Davies (1982)]. 


12. Calculer le retard At d’un écho radar sur une planète en utilisant la métrique PPN sous la forme 
standard. Comparer (et discuter) avec le résultat calculé avec la forme isotrope. 


13. Pourquoi la comparaison des mesures d’écho radar sur une planète lorsque les systèmes Terre~ 
Soleil-Planète sont en conjonction inférieure ou supérieure permet—elle d’éliminer les incertitudes sur 
les propriétés réflectrices de la surface de la planète? 


14. A partir du principe de Fermat, écrit sous la forme 
6 f n(r)de=0, 


(i) Montrer que les trajectoires des rayons lumineux obéissent à 
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& (ne) d) =Vni(r); 


(ii) en déduire la déviation des rayons lumineux si n(r) est donné par les relations (7.93) et (7.95). 


15. Dans un plasma — tel celui de la couronne solaire — une onde électromagnétique (transverse) se 
propage selon la relation de dispersion 


wW- k =w, 


où la fréquence plasma wp est donnée par 
2 Ar pe? 
Wp = —m 


(p : densité électronique). 


(i) Calculer l'indice du plasma [rapport de la vitesse de la lumière à la vitesse de phase] en fonction 
de w et p. 


(ii) En utilisant le principe de Fermat [Ex. 14}, montrer que, si p est une fonction de r, alors une 
onde lumineuse est déviée par le plasma. Préciser à queile(s} condition(s) sur p(r). 


(iii) Calculer cette déviation dans le cas du Soleil, pour des ondes radio. On donne, pour r>2.5Ro, 


108 


p(r) = 1 + ns. 
(r/Ro)® (r/Ro) 


(p est exprimée en électrons par centimètres cubes). 


Figure 7.22 : Exercice 19. 


16. Dans le cas d’une lentille gravitationelle ponctuelle et d’une source également ponctuelle, 
déterminer la position angulaire Bo de la source en fonction des grandeurs observables. 


17. Pourquoi, dans un mirage gravitationnel, la source et ses images possédent-elles le même 
décalage spectral? 


18. Démontrer les relations (7.127)-(7.129) qui caractérisent l’amplification lumineuse dans les 
mirages gravitationnels. 


19. Dans ce problème, on se propose de montrer que les deux images d’une source située derrière un 
déflecteur ponctuel peuvent avoir une vitesse apparente supérieure à celle de la lumière (les notations 
employées sont celles utilisées dans ce chapitre). On suppose que la source se meut orthogonalement à 
l'axe OD, à la vitesse v. On appellera x la distance de l’axe OS à l'axe OD. On appellera s la distance 
entre les deux images Sj et S2 [Fig. 7.22]. 
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(i) Montrer que s=(lop +/ps)(~1+¢2) et exprimer cette grandeur en fonction de z,lop,los et 
du rayon gravitationnel de la lentille. Montrer que l’on a aussi 


2=lop+tips yy. 
lop 


(ii) Calculer alors la vitesse relative ds d’éloignement des images S, et S2 et en déduire que, si 
lbs lon, alors 14 | peut être arbitrairement grand [Réf. : L. Kh. Ingel’ (1975)]. 


20. A partir de la métrique la plus générale à symétrie sphérique (7.66), i.e. à partir de 
ds?=e" dt? —e*dr?—17d0? , 


(i) Montrer que les composantes non nulles du tenseur de Riemann s’écrivent 


Rio < TNE R12 =drv'e "à 
R502 =—4rv'e* Ris =gr\e À sin? @ 
Roos =- drv'e 2 sin? 6 Rs  =(1-e~*) sin? 0 


(ainsi que les équations obtenues à l’aide des permutations convenables des indices). 
(ii) En déduire que les composantes non nulles du tenseur de Ricci Ris sont données par 
Roo =e” * IP ES CSS - à] 
Rii she" —de'n'+402- x) 
R22 =e [1thr(v/-N)]-1 
Rss ={e* [1+ hr(v/-d’)]-1} sin? 6. 


(iii) Vérifier que le scalaire de courbure est donné par 


R=e~* [-v ger’ de7 Bl) 3] ++. 


21. Soient deux observateurs {K} et {K’}, respectivement inertiel et uniformément accéléré dans 
M2. Leurs trajectoires d’univers sont 


z=a (pour{K}) et #?-x?=-a? (pour{K’}). 


(i) Tracer un diagramme d’espace-temps dans le système de coordonnées inertielles liées à {K}. 


(ii) {K} envoie des signaux électromagnétiques vers {K’}. Vérifier qu’au-delà d’un temps to, 
que l’on déterminera, {K’} ne peut plus recevoir les signaux émis par {K}. Montrer qu’avant un temps 
tı, que l’on déterminera, {K} ignore l’existence de {K’}. Ainsi l’horizon de {K} relativement à {K’} 
est défini par toet tı. 


(ii) On considère maintenant le système de coordonnées (£,x) 
t=€ shx 7 a= shx 


(coordonnées de Rindler). Comment s’écrivent, dans ce système, (a) la métrique, (b) l’équation de 
{K’}, (c) l'équation de {K}? 
(iv) Comment s’écrit l’équation du cône de lumière dans ce système de coordonnées ? 
y 


(v) Calculer le décalage spectral des signaux électromagnétiques émis par {K’} et reçus par {K}. 


CHAPITRE 8 


La gravitation relativiste 
d’ Einstein 


(Relativité Générale) 


Dans les chapitres précédents, nous avons vu que les modifications introduites 
par la relativité à la théorie de la gravitation, essentiellement via la célèbre rela- 
tion E = mc? [Chap. 4], se traduisaient principalement par la quasi-nécessité 
d’adopter un espace-temps courbe, également conséquence du principe d’équiva- 
lence [Chap. 6 et 7]. Cependant, ce principe ne précise pas du tout ce que sont les 
équations auxquelles obéissent les dix composantes du tenseur métrique g,,,; tout 
au plus la relation Æ = mc? suggère-t-elle que ces équations sont nécessairement 
non linéaires [Chap. 4]. Dans ce chapitre, nous étudierons les équations les plus 
simples, compatibles avec l’observation, et montrerons d’où elles sont issues : il 
s’agit des équations d’Einstein, dont l’étude (ainsi que celle des espaces—temps 
auxquels elles conduisent) est la Relativité Générale. Nous en déduirons également 
quelques conséquences élémentaires importantes pour l’ Astrophysique Relativiste. 

En fait, si la courbure de l’espace-temps exprime, au travers de l’existence d’un 
tenseur métrique g,,, non trivialement réductible à 9... les effets de la gravitation sur 
les différents phénomènes physiques, cela n’exclut nullement l'existence d’autres 
champs à longue portée qui pourraient également jouer un rôle. Un exemple notable 
est constitué par la théorie de C. Brans et R.H. Dicke (1961) dans laquelle un champ 
scalaire coexiste avec le tenseur métrique. En dernier ressort, cependant, l’existence 
de tels champs devrait être déterminée ou, à tout le moins, limitée [C. Will (1981)], 
par un recours à l’expérience ou à l’observation, en l’état actuel des choses, il 
semble bien que le seul tenseur métrique g,. suffise à rendre compte des faits 
d’observation disponibles et que la Relativité Générale d’Einstein constitue “la” 
bonne théorie de la gravitation relativiste. 

Notons encore que des arguments simples permettent d'éliminer des théories 
relativistes de la gravitation basées uniquement sur l’usage de champ scalaire ou 
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vectoriel. D’abord, la généralisation relativiste la plus simple de l’équation de 
Poisson, pour un champ de gravitation scalaire, s’ écrit 


O = 4rG x (densité de masse). (8.1) 


Comme dans le cas relativiste la densité de masse (ou d’ énergie et d’impulsion, 
grandeurs inséparables) est représentée par le tenseur énergie-impulsion T#”. Le 
seul scalaire ayant la dimension d’une densité d’ énergie que l’on puisse construire à 
partir de ce tenseur est sa trace, de sorte que l’équation (8.1) s’écrit nécessairement 
sous la forme 


D = 4rGT4,. (8.2) 


Bien que cette équation généralise l’équation de Poisson de manière relativiste, 
elle doit être rejetée car (jointe aux équations du mouvement appropriées) elle 
conduit à un retard du périhélie de Mercure, sans parler d’un ordre de grandeur 
incorrect pour cet effet. Bien plus, elle ne permet pas de coupler la gravitation 
et l’électromagnétisme car T” pem = 0 : dans un tel modèle, il ne peut donc 
y avoir ni décalage spectral d’origine gravitationnel, ni déflexion de la lumière 
au voisinage de masses importantes. Naturellement, ces arguments n’excluent pas 
que des modifications sophistiquées (et sans doute quelque peu artificielles) ne 
puissent pallier ces inconvénients. Quant à une gravitation relativiste basée sur un 
champ vectoriel, on l’élimine sur la base du fait que deux particules massives se 
repousseraient au lieu de s’attirer... Naturellement, une combinaison de ces trois 
sortes de champ (tensoriel, vectoriel, scalaire) peut parfaitement être en accord avec 
l’observation et de tels modèles ont été étudiés. 

Quoi qu’il en soit, nous nous limiterons ici à la théorie d’ Einstein où la gravitation 
courbe l’espace-temps et où le tenseur métrique constitue le seul champ possible 
pour la décrire. 


Les équations d’Einstein 


Avant d'obtenir ces équations, il faut insister sur le fait qu’elles constituent un 
postulat supplémentaire, largement indépendant du principe d’équivalence et que 
nous pourrions donc parfaitement poser a priori. Toutefois, pour naturel que soit ce 
postulat, il vaut mieux en indiquer et discuter les sources ainsi que les contraintes 
qui y conduisent. 

Nous exigeons d’abord que les équations de la gravitation se réduisent à 
l’équation de Poisson, à la limite newtonienne des faibles vitesses et des champs de 
gravitation peu intenses. Il s’agit là d’une contrainte minimale qui peut être réalisée 
en imposant que les équations relativistes soient — tout comme les newtoniennes — 
du second ordre pour ce qui est des dérivées du tenseur métrique g,,,, et, de plus, que 
ces dérivées secondes y apparaissent linéairement. Ces deux hypothèses doivent 
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conduire à l'équation de Poisson mais, si elles peuvent constituer des conditions 
suffisantes pour y parvenir, elles ne sont absolument pas nécessaires. Il s’agit donc 
essentiellement ici de considérer les hypothèses les plus simples. On peut cependant 
arguer du fait que si l’on souhaite pouvoir formuler un problème de Cauchy pour le 
champ de gravitation dans les termes usuels +, alors seules des dérivées du second 
ordre (et aussi du premier ordre, bien évidemment) doivent intervenir dans les 
équations relativistes. Quant à la linéarité en les dérivées secondes de g,,,,, c’est 
évidemment le moyen le plus simple d’obtenir l’équation (linéaire) de Poisson, 
compte tenu de ce que goo ~ 1 — 2@/c? à l'approximation newtonienne. 

La seconde idée que nous devons mettre en œuvre est l'intuition fondamentale 
d’Einstein qui se traduit par l’ “équation” (relativiste) 


Courbure = Matière. (8.3) 


Toutefois, la courbure se traduit par le tenseur du quatrième ordre de Riemann- 
Christoffel R,vog tandis que la présence de matière, elle, s’exprime au moyen du 
tenseur du second ordre T,, le tenseur énergie-impulsion. Aussi n’est-ce que par 
l'intermédiaire de contractions de R vag que l'équation (8.3) pourra être réalisée 
et l’on écrira formellement 


Ky = 8"GT yy (8.4) 


où K, est un tenseur (à déterminer) construit à partir du tenseur de Riemann- 
Christoffel et du tenseur métrique. Naturellement, les équations (8.3) ou (8.4) 
satisfont bien les critères précédents puisque, rappelons-le, Ryvag est le seul 
tenseur (du quatrième ordre) qui soit linéaire en les dérivées secondes du tenseur 
métrique (et leurs contractions avec ce dernier tenseur). Le tenseur K, doit être 
symétrique dans l échange u <— v et sa forme la plus générale est donc 


Kw = a Ruw + BR qu + Q À Guv ; (8.5) 


où a, b et À sont des constantes, pour le moment arbitraires. Pour les déterminer, il 
faut se rappeler que le tenseur énergie-impulsion est conservatif, 


VAT“ = 0, (8.6) 


et donc que K, doit l’étre également et ce, quel que soit T,,,, 


V, K” = 0. (8.7) 


1. On souhaite pouvoir trouver le champ de gravitation g,» au point x de la variété d’espace-temps 
connaissant les dérivées 8,9,» et guy au “temps t”, c’est-à-dire sur une 3-surface du genre espace. 
Ceci implique que les équations à résoudre soient — s’il s’agit d'équations aux dérivées partielles — du 
second ordre. 
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Utilisant maintenant la relation (3.131) et les identités de Bianchi (6.58), c’est- 
à-dire 


VË gw = 0 (8.8) 
et 
Vy Ryvop + Ve Rwrw + Va Ruvpr. = 0 (8.9) 
respectivement, la relation (8.7) s’ écrit 
V, K", = (= +6) Vito; (8.10) 
qui implique que b = —a/2, car V, R ne peut être nul partout (sauf dans le cas de 


l’espace de Minkowski, non courbe). Le tenseur K,., a donc la forme 


I 


Ky = @[Guv + Agu] (8.11) 


avec 


1 
Gw=a [Ru — zRo (8.12) 


où G,, est le tenseur d'Einstein. Finalement, la seule équation que l’on puisse 
écrire compte tenu des contraintes précédentes a la forme 


1 8rG 
Ryw = a Juv + AGuv D A Tuv (8.13) 


et constitue l’équation d’Einstein, lorsque a = 1. La constante À est appelée 
constante cosmologique et n’a été introduite par Einstein que dans le but d’ obtenir 
un Univers statique [R. Hakim (1992)]. 

Il reste encore à vérifier que l’équation (8.13), avec À = 0 et a = 1, se réduit 
bien à l’équation de Poisson à la limite newtonienne. La limite des champs de 
gravitation faibles implique que, dans le membre de gauche de 1’ équation (8.13), 
on ne retienne que les termes linéaires dans la déviation h,,,, du tenseur métrique 
guv relativement à 9, : 


Iw ~ Nw + hw et [Purl] < 1, (8.14) 


ainsi qu’une linéarisation analogue pour les dérivées. 

La limite des vitesses faibles affecte le membre de droite de l’équation (8.13), 
puisque Ty décrit l’état de la matière, y compris son mouvement. Par exemple, 
si nous considérons un “schéma fluide parfait”, c’est-à-dire un tenseur énergie— 
impulsion de la forme 


Tw = (p+Pu,u, — Pow, (8.15) 
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le rapport T;;/Too sera donné par 


Taj _ eae — Poi (8.16) 
Too (e+ P) uous — P goo 
Toutefois, comme P/c? < p, l'équation (8.16) se réécrit 
Ti 2 P gi 
RS NE 8.17 
Too “Pp Yoo ore 


compte tenu de ce que uo = goou° (en supposant, ce qui est vrai pour une 
métrique statique dans un système de coordonnées adaptées, go; = 0) et de ce 
que v; = u;/uo. D’autre part, le rapport gi:/go0 est d’ordre unité, compte tenu 
de l’approximation des champs faibles (8.14) et comme P < pc”, le rapport 
(8.17) est d’ordre v?/c? et est finalement négligeable. De manière générale, 
à l'approximation newtonienne, les composantes spatiales du tenseur énergie- 
impulsion sont négligeables, comparées à la composante temporelle : 


[Tyl & Too = P; (8.18) 
en d’autres termes, l'équivalent énergétique des tensions est très inférieur à la 
densité d’ énergie p. 

Dans ces conditions, prenant la trace de l’équation (8.13), il vient 


8rG 
-R+4\= = Phy (8.19) 
8 
a u To, (8.20) 


de sorte qu’à l’approximation newtonienne, la relation (8.13) écrite pour les 
composantes zéro donne alors 


4nG 
Roo © +A goo + Foo (8.21) 


où l’on a tenu compte de ce que Too = 9007, toujours dans le cas d’une métrique 
statique et en négligeant les T7. Utilisant maintenant le fait que 


Roo © +0; Tha (8.22) 


(que l’on obtient aisément en linéarisant l’expression de Roo et en utilisant encore 
le caractére statique de la métrique), on obtient [cf. Eq. (7.53)] 


; le 
00 = 3°" 0; hoo , 
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c’est-à-dire 


1 4nG 
5 V hoo œ +A(hoo + 1) + TP (8.23) 


ou encore [avec hog = +2¢ où ¢ est le potentiel newtonien; cf. Eq. (7.57)] 


V?’ = A(1+2¢) + TS, (8.24) 


qui est bien l’équation de Poisson dès lors que À = 0 eta = 1. 
Une forme utile des équations d’Einstein est la suivante : 


Ruy = 81G |Tyy — : Ju ase (8.25) 
obtenue en remplaçant la courbure scalaire R, dans l’équation (8.13), par son 
expression (8.19), avec À = Qeta = 1. 

A ce stade, il faut remarquer que, si les équations d’ Einstein (8.13) ou (8.25) sont 
au nombre de 10 pour les 10 inconnues que sont les composantes g,,,, du tenseur 
métrique, les quatre relations (identités de Bianchi contractées) 


V, G” =0, (8.26) 


qui découlent des relations (8.12) et des identités de Bianchi, sont automatiquement 
satisfaites, ce qui ne laisse subsister que six équations indépendantes. Il existe donc a 
priori quatre équations de moins que nécessaire. En fait, l’indétermination partielle 
des g,,, correspond à l’arbitraire des choix de systèmes de coordonnées : des 
coordonnées étant spécifiées — quatre conditions étant donc imposées — les équations 
d’ Einstein permettront effectivement la détermination du tenseur métrique. Encore 
faudra-t-il préciser soigneusement les conditions initiales et les conditions aux 
limites utilisées. 

En conclusion, la géométrie locale de l’espace-temps n’est pas déterminée a 
priori mais est causée par la répartition et le mouvement de la matière. Réciproque- 
ment, ces derniers sont influencés par la géométrie locale de l’espace-temps. En ce 
sens, la Gravitation Relativiste d’Einstein est une théorie complète, du moins quant 
aux propriétés locales de l’espace--temps : ce dernier devient un élément dynami- 
que per se et cesse d’être une arène inerte où se déroulent les divers phénomènes 
physiques; bien au contraire, ceux-ci modifient l’espace-temps. A cela, il convient, 
malgré tout, d’apporter une nuance importante, car les conditions aux limites (par 
exemple à l’infini) ne sont absolument pas définies par la Relativité Générale seule : 
toute hypothèse globale est de nature cosmologique. 

Revenons pour clore cette section à la constante cosmologique À, constante que 
nous avons prise égale à zéro. Nous avons déjà indiqué qu’ Einstein I’ avait introduite 
afin d’obtenir une solution cosmologique statique (c’est-à-dire sans expansion ni 
contraction — à une époque où la découverte de l’expansion de l’ Univers par Hubble 
n’avait pas encore été effectuée) et donc conformément aux idées de son temps sur 
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la notion d’espace. En réalité, un terme cosmologique avait déjà été introduit dans 
la gravitation newtonienne par H. Seeliger (1895, 1896) et C. Neumann (1896) avec 
les mêmes motivations qu’Einstein [voir H. Bondi (1961)] et la seule contrainte 
à laquelle ce terme devait être astreint est que sa contribution au mouvement des 
planètes — voire des galaxies dans un amas — fût négligeable. Les estimations 
actuelles [A.D. Dolgov et Ya. B. Zeldovich (1981)] fournissent À < 10757 cm~?, 
cette petitesse extrême posant elle-même problème [Ya. B. Zeldovich (1983) et 
S. Weinberg (1981)]. Notons enfin que si l’on fait passer le terme cosmologique 
Aguy dans le membre de droite de l’équation d’Einstein (8.13), avec a = 1, 
ce terme peut être interprété comme étant le tenseur énergie-impulsion du vide 
puisqu’en l’absence de matière (i.e. lorsque Tpu = 0) il subsiste et est conservatif 
[cf. Eq. (8.8)]. 


Autres déductions des équations d’Einstein 


Il existe de nombreuses déductions des équations d’Einstein, toutes plus ou 
moins équivalentes, mais qui éclairent la théorie sur tel ou tel point particulier. Il en 
existe d’autres aussi qui, dans leur esprit et leurs bases physiques, sont cependant 
très différentes. Il est d’autant plus remarquable qu’on obtienne les équations 
d’Einstein, dans chaque cas presque à coup sûr. Comme, d’autre part, toutes les 
indications expérimentales ou observationnelles [C.M. Will (1981)] connues à ce 
jour confirment la théorie d’Einstein plutôt que la plupart des nombreuses théories 
concurrentes, il semble bien que la Relativité Générale recèle quelque propriété 
fondamentale de la matière, encore mal comprise. 

Dans cette section, nous donnerons des indications sur deux exemples très 
différents de déduction des équations d’Einstein, l’une due à D. Hilbert (1915), 
dont les hypothèses de base sont les mêmes que celles utilisées précédemment, et 
l’autre due à plusieurs auteurs et basée sur l’analogie formelle entre les équations 
des particules de masse nulle et de spin 2 et les équations d’Einstein linéarisées. 

1. Commençons par l’approche de D. Hilbert (1915), une approche variation- 
nelle qui, quoique basée sur les mêmes hypothèses ? que ci-dessus, est intéressante 
à bien des égards. Considérons donc un système physique quelconque, composé de 
particules et/ou de champs non quantiques, caractérisé par un lagrangian Lmat. et 
obéissant, en l’absence de gravitation, aux équations d’Euler-Lagrange habituelles 
[Appendice C]. Soit maintenant Lrav. le lagrangien, pour le moment indéterminé, 
de la gravitation, c’est-à-dire celui qui doit donner lieu à des équations satisfaites 
par le tenseur métrique g,,. Au passage, notons que si Lorav. ne dépend pas a 
priori de l’état de la matière, par contre Lmat. est fonction des propriétés locales de 
l’espace-temps via le tenseur métrique g, : Lmat. Contient donc le couplage entre 
matière et gravitation, de sorte que nous poserons, comme un principe, la validité 
du principe variationnel suivant : 


2. Pour les relations entre Hilbert et Einstein et la découverte des équations relativistes de la gravitation, 
voir J. Mehra (1974). 
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6§ =0=6 | Vg|d4a [Lgrav. + Lmat.] - (8.27) 


Dans cette dernière expression, le facteur 4/|g| a été introduit de manière 
que l’élément d'intégration soit invariant dans les changements de système de 
coordonnées [Appendice B] : 


Vigldtz = vig’ dtr’ . (8.28) 


Déterminons maintenant le lagrangien Lgrav., compte tenu de ce que l’on 
souhaite obtenir des équations linéaires en les dérivées secondes du tenseur métrique 
et qui se réduisent à l’équation de Poisson à l’approximation non relativiste. La 
première hypothèse conduit immédiatement au lagrangien 


Lgrav. = const. x [R — 2A], (8.29) 


R étant le seul scalaire possible construit à partir de guv et Ruvap, linéaire en 
dap9uv : À est une constante pour le moment arbitraire mais qui apparaîtra comme 
étant la constante cosmologique. La constante multiplicative dans l’expression 
(8.29) est déterminée par la nécessité de retrouver l équation de Poisson à la limite 
newtonienne. 

Les équations de la gravitation relativiste peuvent maintenant être obtenues à 
l’aide du principe variationnel (8.27) [voir, par exemple, J.L. Anderson (1967); 
S. Weinberg (1972); Ch. W. Misner, K.S. Thorne, J.A. Wheeler (1973)]. Il faut 
cependant noter que Lerav. est du second ordre (en les dérivées du champ de 
gravitation) et l’on ne peut donc appliquer telles quelles les équations d’Euler- 
Lagrange habituelles données dans l’appendice C. Elles doivent donc être généra- 
lisées. On peut, toutefois, utiliser une procédure plus simple * qui consiste à faire 
varier indépendamment g,,,, et TË 8 (qui apparaît implicitement dans À), la varia- 
tion par rapport aux T fournissant leur expression en termes des gy, et Ooguv. À 
l’aide des relations 


1 
ô u= 191 94° 6 guy (8.30) 


69°? = —g% g” Egu (8.31) 
on obtient alors les équations 
1 6Lmat. 1 
const. x | Ruy — Rou + dau = A = zIuvLmat. » (8.32) 


3. Cette méthode est due à A. Palatini (1919). Son analogue en mécanique, électromagnétisme, etc., 
est discuté dans Ch. W. Misner, K.S. Thorne, J.A. Wheeler (1973), pages 493 et suivantes. 
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qui constituent bien les équations d’Einstein si la constante apparaissant dans le 
membre de gauche est prise égale à (87G)~! et si le tenseur énergie-impulsion de 
la matière est identifié à 

__ OL mat. 1 


mat. = dg ~ 2 gh Lmat. . (8.33) 
pv 


Cela n’est évidemment possible que si le tenseur (8.33) est conservatif et s’il ne 
diffère du tenseur énergie-impulsion canonique [Appendice C] que par des termes 
à divergence (covariante) nulle. Cela se démontre sans difficulté particulière [voir 
les références citées plus haut]. La relation (8.33) possède l’ avantage de fournir un 
tenseur énergie-impulsion symétrique, ce qui n’est, en général, pas le cas du tenseur 
canonique [F. Belinfante (1940); L. Rosenfeld (1940)] : l’invariance du lagrangien 
Lmat. dans des changements de coordonnées infinitésimaux 


zt = z” + (x) (8.34) 
conduit à la conservation du tenseur énergie-impulsion de la matière : 


ey 
Vulimat. TT 


2. Une autre approche, due originellement à S.N. Gupta (1954) (1957) (1962), 
et perfectionnée par la suite [R.H. Kraichnan (1955); W. Thirring (1961); R.P. 
Feynman (1962); S. Weinberg (1965); S. Deser (1970) (1971)], est radicalement 
différente *. Elle est basée sur le fait qu’en physique quantique, un champ de spin 
2 est représenté par un tenseur symétrique, d’ordre 2 et sans trace. Aussi l’idée 
d'interpréter le champ guy comme étant directement lié à un champ classique (i.e. 
non quantique) de spin 2 est-elle très naturelle. Cependant, plutôt que de partir 
directement des équations du champ de spin 2 [M. Fierz, W. Pauli (1939)], nous 
suivrons les démarches de R.P. Feynman (1962) et S. Deser (1971), dont nous 
n’indiquerons, malgré tout, que les principales étapes. 

Considérons donc un champ tensoriel classique h,,,, symétrique, et écrivons le 
lagrangien le plus général auquel il obéit, compte tenu du fait qu’il est nécessaire- 
ment composé de combinaisons quadratiques des dérivées premières Oy hog : nous 
souhaitons obtenir des équations du second ordre qui soient linéaires. Le fait qu’il 
s’agisse d’un champ de masse nulle impose que ce lagrangien ne contienne pas 
de terme quadratique en hs. Ce lagrangien s’écrit alors, de manière tout à fait 
générale, sous la forme * 


L= adghyy ITR” + OR gly? + COR pha” 
+ dôho ho — X hy TE, , (8.35) 


4. Lun des meilleurs exposés est, sans doute, celui de R.P. Feynman (1962), un texte malheureusement 
difficile à trouver; voir aussi S. Deser (1971). 


5. Notons que, dans les équations qui suivent, les indices tensoriels sont tous des indices lorentziens. 
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où x est une constante, pour le moment, arbitraire et od (a,b,c,d) sont des 
constantes à déterminer. Dans cette équation, TÉ, est le tenseur énergie- 
impulsion de la matière et le dernier terme constitue le seul couplage possible 
conduisant à des équations linéaires; le tenseur THX, doit évidemment être 


conservatif. Les équations du mouvement s’écrivent alors [Appendice C] : 


2aDhag + bOg(ahpy T+c {0a8ho TL Nap ph” } + 
F 2d NagOho ? = X TaBmat. : (8.36) 


Les coefficients (a,b,c,d) sont maintenant déterminés en imposant que le 
membre de gauche de cette derniére équation soit invariant de jauge (voir plus 
loin). Un choix possible est alors a = 1/2, b = —1, c = 1, d = —1/2. Tout autre 
choix fournit une constante multiplicative que l’on peut toujours absorber dans x. 
On peut donc écrire, finalement, 


has = Oo(ahp) abe {Oogh + Nap puh” } i napOh 


= X Tafmat. ; (8.37) 


où l’on a posé h = ho 7. A l’aide du changement 


= 1 
huw — hw = hw — gwh, (8.38) 
T équation (8.37) se réécrit sous la forme 
Ohyy' — auha + Nua hos = X Tuvmat. - (8.39) 


Les équations (8.37) ou (8.39) sont, en fait, essentiellement identiques aux 
équations d’Einstein linéarisées (voir plus loin); elles ne sont, cependant, pas 
physiquement correctes puisqu’elles ne contiennent pas la contribution du champ 
de gravitation h,, lui-même à l’énergie-impulsion. Il convient donc d’obtenir 
cette contribution — qui sera nécessairement non linéaire en h,, et O,h,, — et de 
la rajouter dans le membre de droite de l’équation (8.37) ou (8.38). Si l’on appelle 
N#” cette contribution, elle devra être telle que 


Où (net. + N°] = 0, (8.40) 


6. A priori, on pourrait rajouter au lagrangian un terme du type 8 h””.ð h7 „; cependant, un tel 
terme peut dans l’intégrale d’action, à l’aide d’une intégration par partie, être réduit en un terme du type 
shp” Bh”. 
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et l’on aura également 


yy — auha + NyvO Rap = x {Tuvmat. + Nuv(hpo)} + (8-41) 


Le tenseur N,,, peut être obtenu à partir du lagrangien (8.35) et apparaît alors 
comme quadratique relativement aux 0\h,,. L’équation (8.41) apparaîtra alors 
comme bilinéaire et elle devra étre déduite d’un lagrangien cubique, etc. Ce 
processus itératif conduit, en fin de compte, à un N,,, qui, ajouté au membre 
de gauche de l'équation (8.41), donne exactement les équations d’Einstein. Ce 
processus est assez compliqué en pratique mais, grâce à une technique habile, il se 
trouve que l’on obtient le résulat exact seulement au bout d’une itération [S. Deser 
(1970) (1971)]. 


La solution de Schwarzschild 


La première des solutions exactes des équations d’ Einstein est due à K. Schwarz- 
schild (1916) et joue un rôle ? particulièrement important dans la vérification de la 
Relativité Générale au sein du système solaire (les fameux “tests classiques”). Elle 
constitue, en effet, le pendant relativiste du potentiel newtonien g(r) = —-GM/r:i 
s’agit donc d’une solution statique, à symétrie sphérique, minkowskienne à l'infini, 
d’une particule située à l’origine £. 

En coordonnées standard, la métrique de Schwarzschild s’écrit 


ds? = (1 am dt? _ dr? — r? [d0? + sin? Odp”] , (8.42) 
r (1 - 2%) 

et nous allons la déduire d’abord de manière purement intuitive, sans qu’il faille, 

naturellement, prendre cette déduction trop au sérieux; nous l’obtiendrons ensuite 

à partir des équations d’ Einstein. 

1. Considérons donc une masse M, située à l’origine des coordonnées r = 0, et 
soit une particule-test en mouvement dans le champ de gravitation dû à la masse 
M, et située à la distance r. Du fait de la symétrie sphérique du système, il existe 
certainement des trajectoires circulaires pour la particule—test, qui vérifient au moins 
approximativement v? = GM /r; de manière générale, nous poserons 


GM 
v = a=, (8.43) 


7. L'histoire détaillée de la solution de Schwarzschild peut être trouvée dans le travail de J. Eisenstaedt 
(1982). 

8. Strictement parlant, cette solution est une solution de l’espace vide (T,,=0] presque partout et 
la variété d’espace-temps dont elle est la métrique est choisie comme étant V*=RxRt xS?; R 
correspond au temps, R* à la coordonnée radiale moins l’origine r=0, et S? est la sphère usuelle (voir 
plus bas). 
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où a est une constante à déterminer par la suite (a = 2 pour des trajectoires 

newtoniennes paraboliques). Un observateur, lié à la masse M et mesurant un 

intervalle de temps dt et un intervalle de distance dr dans un référentiel lié à la 

particule-test, trouvera un intervalle de temps dt’ dilaté avec le facteur habituel 
dt’ 


dt = === ‘= . 
t Fas (adr’ = 0) (8.44) 


et un intervalle de longueur dr’ contracté comme 


dr = dr' /1—v2— (adt’ = 0). (8.45) 


Compte tenu de ce que, dans son système de coordonnées locales {t’,r’}, 
l’observateur lié à la particule-test admet la métrique lorentzienne (on suppose 
qu’il est très loin de la masse M) 


ds? = dt? — dr? , (8.46) 


en reportant les relations (8.44) et (8.45) et en remplaçant v par son expression 
(8.43), il vient 


2 GM) n2 1 2, 

ds? = (1 a— ) dt (a) dr” ; (8.47) 
il reste maintenant à déterminer le coefficient a, ce qui ne présente pas de difficulté 
si l’on se souvient qu’à l’approximation newtonienne, on doit avoir goo © 1 + 2¢ġ; 
il vient donc immédiatement a = 2 et (8.47) est bien la solution de Schwarzschild 
avec dð = dp = Q. Inutile de préciser que cette “démonstration” est tout a 
fait approximative. Elle présente seulement |’ avantage d’exhiber directement deux 
phénomènes liés à la métrique (8.42) : la modification des étalons de temps et de 
longueur. 


2. Revenons maintenant à la solution de Schwarzschild (8.42) et discutons-la 
un peu. Plaçons-nous d’abord à t = const., i.e. à dt = 0, donc sur une 3-surface 
du genre espace, à métrique définie positive donnée par 


dr? 


2 — 
do joe t" 
r 


2 [dé + sin? Ody] . (8.48) 

Ces 3-surfaces du genre espace, orthogonales aux lignes de temps, sont évi- 
demment toutes identiques ? quel que soit l'instant t considéré. Elles possèdent 
également la symétrie sphérique. Les 2-surfaces qui y sont contenues, et d’équa- 


tion r = const., sont des 2-sphères usuelles ainsi que l’indique leur métrique 


do? = r? (dé? + sin? 6dp°| , (8.49) 


9. Cette circonstance est générale pour les espaces-temps statiques. 
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de surface S = 4mr?; ceci constitue d’ailleurs la seule interprétation un peu concrète 
de la coordonnée radiale r. Notons, cependant, que la métrique (8.48) ne définit 
que la structure locale des 3-surfaces t = const. et ne dit rien quant à leurs 
propriétés globales '°, leur topologie. Cette circonstance est tout à fait générale en 
relativité : les équations d’Einstein déterminent les propriétés locales de la variété 
espace-temps mais non ses propriétés globales qui doivent être imposées a priori. 

Pour avoir une idée plus précise des 3-surfaces t=const., nous allons en obtenir une représentation 


par une 2-surface de R3, correspondant à la métrique (8.48) avec 0=r /2. Cette 2-surface admettra 
alors la métrique 


do? = -Hir +r? dy? , (8.50) 
r 
et peut étre considérée comme étant constituée par une surface de révolution, d’axe Ow, engendrée 
par une parabole w=w(r) : 
w? (r) =8GM .{r-2GM]. (8.51) 


Cette 2-surface est le paraboloide de L. Flamm (1916). Il s’agit donc d’un plongement de cette 
2-surface dans un espace euclidien à trois dimensions; mais si x et y correspondent bien aux 
coordonnées de Schwarzschild, w n’a pas de sens particulier. Il convient également de noter que 
seuls ont un sens les points de cette 2-surface et non pas tous les points de l’espace R$ dans lequel 


elle est plongée 1! [Fig. 8.1]. 


Figure 8.1 : Représentation des 3-surfaces ¢ = const. par le paraboloïde de Flamm. 


Une seconde remarque est liée au comportement à grande distance de la métrique 
de Schwarzschild : lorsque r — co, on a 


lim dÉchw. = Sktinkowski 3 (8.52) 


10. Par exemple, si l’on identifie deux points diamétralement opposés de la sphère usuelle S?, on obtient 
le plan projectif P?, qui admet la même métrique mais n’est pas orientable. 


11. L'utilisation du paraboloïde de Flamm est discutée dans W. Rindler (1977). 
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autrement dit, l’espace-temps de Schwarschild est asymptotiquement plat. Toute- 
fois, lorsqu’on diminue r, on atteint une valeur critique, le rayon de Schwarzschild 
(ou rayon gravitationnel), 


Rg = 2GM/c’, (8.53) 


où la métrique (8.42) devient singulière. S’agit-il d’une véritable singularité de 
l’espace-temps ou bien, plus simplement, du système de coordonnées”? Le calcul 
du tenseur de courbure montre que celui-ci ne présente aucune singularité — reste 
fini — pour r > Rg. Nous avons donc bien affaire à une singularité du système de 
coordonnées, lequel ne permet pas de décrire tout l’espace-temps mais seulement 
une partie de celui-ci. Il nous faudra donc étendre ce système de manière à pouvoir 
le décrire en totalité. Néanmoins, les coordonnées de Schwarzschild n’étant pas 
complètement dénuées de tout sens physique, il doit bien se produire un phénomène 
particulier en r = Ra. En effet, la 3-surface r = Rg scinde l’espace en deux 
régions, l’une inobservable et l’autre observable; cette surface s’appelle l’ horizon 
de Schwarzschild et joue un rôle important dans l’étude des trous noirs. 

Toujours à propos des coordonnées, à t = const., la taille d’un objet est définie 
(à d0 = dé = 0) par 


dr? 


de? = —ds? = r 
GM? 


(8.54) 


qui indique le lien entre la coordonnée radiale r et la distance £ : 


1/2 
EE hia)" y 
o (1-284)? å 


+ 2GM log {fr HOME + an) ; (8.55) 


cette derniére expression, pour une longueur caractérisée par les coordonnées 
radiales rı et r2, peut être approchée par 


L ~ (r2— rı) + GM log (2) ; (8.56) 
1 


le second terme montrant l effet de la courbure de l’espace. Naturellement, lorsque 
r est très peu différent de r2, la distance mesurée £ est elle-même très peu différente 
de To Py. 

De manière analogue, le temps mesuré (à dr = d0 = dy = 0) est donné par 


GM 
dr? = ds? = (1 — 2) dt? (8.57) 
et se réduit bien au temps d’un observateur inertiel habituel, au repos par rapport à 
la masse M, à F infini. 
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Un dernier commentaire, enfin sur la métrique de Schwarzchild. Dans la réalité, 
la masse M n’est pas ponctuelle mais est répartie à l’intérieur d’un certain rayon R : 
pour le Soleil, par exemple, Ro = .7 x 10!1 cm tandis que Rg = 1.5 x 105 cm; en 
général, comme dans le cas du Soleil, ona Rg << R de sorte que la solution (8.42) 
des équations d’Einstein n’est réellement valable que pour r > R, c’est-à-dire en 
dehors de l’étoile considérée : il s’agit donc d’une solution extérieure, une solution 
du vide, que l’on devra raccorder à la solution intérieure de l’étoile. 

3. Donnons maintenant un aperçu rapide de la démonstration qui conduit à la 
métrique (8.42). Les seuls symboles de Christoffel 1? non nuls sont les suivants : 


1 1 
To = a Too = sven T2, = —sin 0 cos0 
1 
Th = À lo = -re ? ri, = —e7*r? sin? 0 
Do = l/r 13, = cotg® T9, = 1/r (8.58) 


de sorte que les seules composantes non nulles du tenseur de Ricci Ry sont 


Roo = — et *), Lin ~- LEN + ay + v'fr (8.59) 
2 4 4 
oln „n_lpy 1 ia _ \ 
Ru = 7” rig A + ru X'/r (8.60) 
-A 1 1 1 
Rz = e h + 9" (v — À | — 1 (8.61) 
R33 = Raz sin? 0 (8.62) 


où l’on a utilisé la forme (7.66) pour la métrique. On vérifie alors que les équations 
d’Einstein se réduisent à R,, = 0. 

Les deux premières équations fournissent immédiatement v’ = —\' qui 
s'intègre en v = À + const.; on peut cependant choisir cette constante comme 
étant nulle, au prix d’un changement d’échelle pour la coordonnée temporelle t. 
L’équation (8.61) donne alors 


e.[1 + rw] =1, (8.63) 


12. Ona, en outre, FF, =[f et TË =T hu 
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qui, en posant b = exp. v, se réécrit 


b+rbo=1 (8.64) 
et s’intégre donc immédiatement pour donner 
eta oe | (8.65) 


où la constante d’intégration est identifée en revenant à l’approximation newto- 
nienne : on obtient ainsi const. = 2GM/c?. Il reste encore à vérifier que la 
métrique (8.42) obéit bien aux équations d’Einstein R,, = 0, séparément; nous 
avons, en effet, utilisé seulement la somme de (8.59) et de (8.60). Notons enfin que 
nous n’avons pas eu à imposer que l’espace-temps soit asymptotiquement plat; 
cela est apparu comme une conséquence de la solution. Bien plus, G.D. Birkhoff 
(1923) a montré que la métrique de Schwarzschild découlait, outre des équations 
d’Einstein, de la seule symétrie sphérique et de l'absence de matière. Cette pro- 
priété constitue le fameux théorème de Birkhoff (1923). Autrement dit, la géométrie 
locale de toute région d’espace-temps à symétrie sphérique et dépourvue de matière 
(i.e. Tuy = 0) est nécessairement la géométrie de Schwarzschild. Ce théorème 13 
justifie donc notre assertion selon laquelle la géométrie extérieure d’une étoile à 
symétrie sphérique est la géométrie de Schwarzschild. 

4. La géométrie interne d’une étoile à symétrie sphérique en équilibre hydro- 
statique est caractérisée par la métrique la plus générale (7.66), que nous pouvons 
toujours réécrire sous la forme 


dr? 
mo 


où (r) et M (r) sont deux fonctions à déterminer : elles constituent seulement une 
réécriture des composantes goo(r) et g-(r) et, à ce stade, ne présentent rien de 
particulier. A approximation newtonienne, @(r) se réduit au potentiel newtonien 
habituel; d’où le nom de potentiel de gravitation attribué à @(r). L'insertion de 
la forme (8.66) de la métrique dans les équations d’Einstein fournit un système 
d'équations couplées — les équations de Tolman-Oppenheimer-Volkov — [pour 
Mr) et p(r)] liées à la densité d’énergie p et à la pression P de la matière dans 
l'étoile. La fonction M (r) apparaît alors comme étant la masse située dans une 
sphère de rayon inférieur à r : 


ds? = [1+ 2¢(r)] dt? r? (de? + sin? 0.dp*] , (8.66) 


M(r) = 4r f dr’ r? p(r’) . (8.67) 
0 


13, La démonstration du théoréme de Birkhoff se trouve dans tous les manuels de Relativité Générale 
et est très semblable à (et aussi simple que) celle qui conduit à la solution de Schwarzschild donnée plus 
haut. 
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Notons encore que l’expression (8.66) est valable pour r < R, où R est le rayon 
de l’étoile, qu’en ce point, on doit avoir 


(R) = -GM/R, M = M(R) (8.68) 
et que la métrique (8.66) est ainsi raccordée 14 à la métrique de Schwarzschild 
extérieure à l’étoile. En outre, à l’origine r = 0, la masse ne joue plus aucun 
rôle (tout comme dans le cas newtonien) et l’espace-temps doit y être localement 
minkowskien, c’est-à-dire : 9(0) = 0 et M(0) = 0. Nous reviendrons plus 
sérieusement sur ces questions dans un autre volume. 


La géométrie locale des espaces de Friedman 


L'une des applications essentielles de la Gravitation Relativiste est constituée par 
la cosmologie, qui a longtemps été “un espace de liberté pour penser la Relativité 
Générale” [J. Eisenstaedt (1987)] et qui, dans ses versions les plus simples, est 
basée sur le principe cosmologique. 

Ce principe affirme d’abord l'existence d'un temps universel; la variété 
d’espace-temps V4 peut alors être toujours décomposée en une partie temporelle 
et une partie purement spatiale V3 


VÉ=R x V*. (8.69) 


Aussi, dans un système de coordonnées adaptées à la structure précédente, peut- 
on écrire la métrique sous la forme générale 


ds? = dt? — dr’, (8.70) 
où dn? est la métrique de la variété spatiale VS. La coordonnée t, comme on le 
remarque sur cette dernière expression, correspond donc au temps mesuré, au temps 
propre d’un “observateur fondamental” dont, par définition, la ligne d’univers est 
orthogonale aux variétés spatiales V [Fig. 8.2]. 

Le principe cosmologique !° affirme, en outre, que les variétés V3 sont ko- 
mogènes et isotropes (ce qui signifie, grosso modo, “nous n’occupons pas une 
place privilégiée dans l’ Univers” et “l’Univers, à grande échelle, apparaît comme 
étant homogène” ou encore “l'Univers a sensiblement le même aspect dans toutes 
les directions”). L’isotropie des sections spatiales V? entraîne que leur métrique 
dn? s’écrit sous la forme (isotrope) 


dn? = B(t,r) dx? , (8.71) 


14. Le raccordement de deux métriques est un probléme délicat et, de fait, il existe plusieurs méthodes 
possibles. 


15. Unexposé simple, techniquement, od sont bien discutés les tenants et les aboutissants de ce principe, 
peut être trouvé dans E.R. Harrison (1981); voir aussi G.FR. Ellis (1973). 
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Figure 8.2 : Observateurs fondamentaux dans un univers de Friedman. 


où la fonction B(t, r) est nécessairement de la forme 


B(t,r) = R°(t) F2(r), (8.72) 


où R(t) et F(r) sont deux fonctions pour le moment inconnues. 

La démonstration de ce que la fonction B (t, r) possède nécessairement la forme 
(8.72) peut être effectuée de manière heuristique, de la façon suivante. Considérons 
à to donné un triangle quelconque ABC et soit A’B’C’ le triangle analogue au 
temps £ (résultant de l’évolution du triangle originel : ainsi AA’, BB’ et CC’ sont 
respectivement sur les mêmes lignes d’univers d’‘“observateurs fondamentaux”) 
(Fig. 8.3]. 

En vertu de l’homogénéité et de l’isotropie, les deux triangles doivent être 
semblables : aucun point et aucune direction ne doivent étre privilégiés. En outre, 
le coefficient de similitude doit étre indépendant, et des triangles choisis, et de la 
position des triangles dans l’espace; il ne peut donc dépendre que du temps. Les gi; 
doivent donc avoir la méme forme a des instants différents, 4 un facteur conforme 
dépendant du temps près. 

La fonction F(r) est ensuite déterminée en constatant que l’homogénéité et 
l’isotropie des sections spatiales V° implique qu’il s’agisse d’hypersurfaces à 
courbure constante et l’on trouve 


1 
2 eo aes 
FE E Ey [avec k = +1,0], (8.73) 


de sorte que, finalement, la métrique cosmologique (ou métrique de Friedman- 
Robertson—Walker) s’ écrit 


d 2 
ds? = dt? — R?(t) —~—, (8.74) 
(1+ &r?) 


en coordonnées isotropes, et 
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Figure 8.3 : L’homogénéité et l’isotropie des sections spatiales implique la similitude de couples de 
triangles (ABC) et (A’B’C’) arbitraires, le coefficient de similitude dépendant alors du temps. 


ds? = dt? — R’(t) { + r° [dé? + sin? ag?) } (8.75) 


1 — kr? 
en coordonnées du type de Schwarzschild. Notons que, pour k = 0, R~?(t)dn? est 
la métrique euclidienne usuelle; pour k = +1, R~*(¢)dn? est la métrique d’une 
3-sphère SŸ, tandis que pour k = —1, R~*(t)dn? est celle d’un espace hyperbo- 
lique H? [voir, par exemple, N. Efimov (1981) ou D. Hilbert et S. Cohn—Vossen 
(1952)]. 

Quant au facteur d’ échelle 18 R(t), il est facilement déterminé +” en introduisant 
la forme (8.74) de la métrique cosmologique dans les équations d’Einstein (ou dans 
toute autre équation de la gravitation relativiste). Notons enfin que la forme de la 
métrique de Friedman—Roberston—Walker ne dépend que des hypothèses contenues 
dans le principe cosmologique (qui est, avant tout, un principe d’invariance) et non 
pas de la validité des équations d’Einstein ou d’autres équations : seule l’évolution 
du facteur d’échelle R(t) en dépend. 

Notons, cependant, que si la matière est décrite par un tenseur énergie-impulsion 
du type “fluide parfait”, donc de la forme 


Tw = (e+ P) Upty — P9w, (8.76) 


où p et P sont, respectivement, la densité d’énergie et la pression du “fluide 
cosmique”, alors la relation de conservation V,T#* = 0 entraîne la contrainte 


16. Parfois improprement appelé le “rayon de |’ Univers”. 
17. Voir, par exemple, E.R. Harrison (1981). 
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PdR?(t) + d[pR3(t)] = 0, (8.77) 


qui s’interpréte comme étant la relation thermodynamique 


TdS = 0 = PdV + du, (8.78) 


où S est l’entropie et U l'énergie interne du fluide cosmique. 

Donnons maintenant une démonstration moins intuitive des formes (8.74) et 
(8.75) de la métrique cosmologique. Le premier postulat contenu dans le principe 
cosmologique est constitué par l’hypothèse de l’existence d’un temps universel. 
Cependant, alors qu’une telle hypothése est implicite dans toute la physique 
(et partant, dans la cosmologie) newtonienne, il s’agit réellement d’un postulat 
indépendant — étudié par H. Weyl dès 1923 — en Relativité Générale. Il n'existe 
pas, en général, de feuilletage de l’espace-temps par des familles d’hypersurfaces 
du genre espace orthogonales à une congruence de lignes du genre temps données. 
Il est nécessaire que ces lignes correspondent à des mouvements irrotationnels et 
sans distorsion. 

Considérons donc des observateurs attachés à des galaxies, sans mouvements 
propres, et soient u” les quadrivitesses de ces dernières, donc tangentes à leurs 
lignes d’univers [Fig. 8.2]. Un observateur-type décrit donc une géodésique du 
genre temps, et l’on a 


+ régutuf = 0. (8.79) 


Dans un repère comobile, i.e. celui de l’un quelconque de ces observateurs, on a 
dz” 

: ds 
et l’équation des géodésiques (7.47) s’écrit alors 


= u” = (1,0), (8.80) 


d? 0 

a tlMputu’ = 0 (8.81) 
d i | 

T + Tigutu® = 0, (8.82) 


équations qui se réduisent respectivement aux deux suivantes : 


r% =0 = 4g% {60900 + ogo — 30900] 
(8.83) 
Tig =0 = 4g" [O0g05 + 3ogjo — 85900] 
(qui expriment que les “molécules” du fluide cosmique sont en chute libre dans 
Y Univers), dont on tire immédiatement 
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=0 
EL (8.84) 


{ Oo Goo 
ði Joo 


Comme la métrique la plus générale invariante par rotation, écrite sous la forme 
dite “isotrope”, est donnée par [Chap. 7] 


ds? = A(t,r)dt? — B(t,r)dzx? , (8.85) 


où A(t,r) et B(t,r) sont des fonctions positives arbitraires, les deux équations 
(8.84) précédentes indiquent que goo ne dépend ni de ¢ ni de r et, par conséquent, 
la métrique (8.85) peut se réécrire 


ds? = dt? — B(t,r)dz’, (8.86) 


où l’on a choisi la coordonnée t de façon que goo = 1 (choix d’une unité de t); t 
est alors le temps propre des observateurs fondamentaux liés à u” [Fig. 8.2]. 

Un tel système de coordonnées est dit synchrone. Les surfaces t = const. 
correspondent à dt = 0; sur ces surfaces, les distances sont mesurées à l’aide 
de la famille de métriques (qui dépendent du paramètre t) 


do? = —ds* = B(t,r) dz? . (8.87) 


Ces surfaces sont des surfaces d’homogénéité, orthogonales aux lignes d’ univers 
du fluide cosmique, dont nous n’avons pas encore montré l existence. 

A cette fin, nous effectuerons une décomposition du champ de quadrivitesse du 
fluide cosmique, analogue à celle du cas newtonien [S. Mavridès (1973)]. Posant 
[voir, par exemple, J.L. Anderson (1967)] 


Wye [Voli Via) Aò AP p (8.88) 
1 

Suv = [Vaup + Vattp — 389%] AZAS, (8.89) 

6=V,u", (8.90) 


où À, est le projecteur sur le 3-espace orthogonal à u” 


Apv = Juv = dub; (8.91) 


la variation du quadrivecteur u”, lorsque les coordonnées spatiales sur la surface 
t = const. ont varié d’une quantité 6z*, est donnée par 


1 
bu" = 6x” Lu.» +o,” + 30 uv , (8.92) 
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où les variations de u et x sont astreintes à la surface t = const. Les divers termes 
de cette équation s’interprétent exactement de la même manière que dans le cas 
newtonien. Ecrivons donc que le fluide cosmique est sans rotation 


Wy = 0 = [ôpux — Ou] A` AP p, (8.93) 


ce qui s’écrit encore 


VAu=0. (8.94) 


ou encore puj) = 0. 

En d’autres termes, le 3-vecteur u est irrotationnel et est donc le gradient d’une 
fonction (x, t). Cette propriété est également vraie pour u” qui est donc orthogonal 
à une famille de surfaces du genre espace. Les lignes d’univers de ce champ de 
4-vecteurs sont évidemment caractérisées par des équations du type x* = const. 

Revenons à la métrique cosmologique; elle a été obtenue pour la première fois par 
A. Friedman (1922, 1924) mais ce sont H.P. Robertson (1935, 1936) et A.G. Walker 
(1936) qui ont, les premiers, démontré que cette métrique résultait uniquement du 
principe cosmologique en tant que principe de symétrie et, par conséquent, était tout 
a fait indépendante des équations d’ Einstein. On pourra trouver cette démonstration 
mathématique, par exemple, dans l’ouvrage de S. Weinberg (1972). Ici, nous 
exposerons une déduction, analogue dans son essence bien que formellement 
différente, qui consistera 4 simplifier et expliciter de plus en plus la forme générale 
(8.85) [que nous avons déjà réduite à (8.86)] en utilisant l’ homogénéité et l’isotropie 
des surfaces t = const. quand nous en aurons effectivement besoin et non de manière 
aussi systématique que dans une démonstration mathématique [L.P. Eisenhart 
(1966)]. 

Ecrivons donc que le mouvement de la matiére s’effectue sans distorsion des 
lignes d’univers moyennes qu’elle suit. On aura donc 


Ow = 0, (8.95) 


ou encore 
1 À 
Vatlp + Voua — 2093] AX, AP p = 0. (8.96) 


Dans un repère synchrone, cette équation s’écrit explicitement 
1 
00 Jij = 30 9 co (8.97) 


Cependant, l’homogénéité des sections spatiales implique que le scalaire de 
dilatation 6 ne peut dépendre que du temps. En effet, deux géodésiques du genre 
temps, orthogonales aux surfaces t = const., considérées 4 deux instants différents 
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Figure 8.4 : Si d(P,,P2)=d(P],p,) au temps t, alors d(M,,M2)=d(M{,M3) au temps t' et ce quels 
que soient les couples de points (P1,P2) et (P{,P3). 


(Fig. 8.4], doivent s’écarter l’une de l’autre d’une même quantité, pour une même 
distance initiale; donc 6 = 4(t). 
L équation (8.97) s’écrit encore 


a 
z Br) = —0() Bit) (8.98) 


qui ne peut avoir de solution que si B(t, r) est de la forme générale 


B(t,r) = R(t) F?(r) ; (8.99) 
ce qui permet d'écrire (8.87) sous la forme 


do? = (Dr nd: (8.100) 

Il reste maintenant à obtenir explicitement la fonction F(r). A cette fin, nous 

utiliserons l’homogénéité et l’isotropie des sections spatiales qui sont nécessaire- 

ment des 3-surfaces à courbure constante. A partir du seul tenseur spatial dont on 
dispose 18, c’est-à-dire 


vs = FP) by, (8.101) 
les seuls tenseurs possédant les propriétés de symétrie du tenseur de courbure que 
l’on puisse former s’écrivent 


O Ria = K [Jik gi — Ju 950] » (8.102) 


18. L’isotropie de l’espace entraîne qu’il n’existe, dans un référentiel synchrone, aucune direction 
privilégiée. 
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où K est une constante arbitraire. Utilisant maintenant l’expression explicite de 
(3) Resets le tenseur de Riemann pour une 3—variété 


GR = Yin [Oh — OTR, + RTE —CRT IG] > (8.103) 


on obtient alors les deux équations différentielles suivantes : 


1E [PEF 
-- | — —| =0 8.104 
rT 5 ii [5] ( ) 

F' F' 2 ‘ 

21 — = KF“ = 0 .10 
PRHE (8.105) 
Tandis que la première équation admet les solutions 
Fi) = —— (8.106) 
~ br? +e’ l 
où a, bet c sont des constantes arbitraires, la seconde impose seulement la contrainte 
b 

K= 4 (8.107) 


Finalement, en absorbant un facteur c/a dans le facteur d’ échelle R(t), en posant 


k2 7 sgn. (b/c) (8.108) 


et en redéfinissant la coordonnée r, (b/c)r? — r?, il vient 


d 2 
do? = RO, (8.109) 
(1+ kr?) 
de sorte que la métrique d’espace-temps s’ écrit bien 
d 2 
ds? = dt? — R(t) —— (8.110) 


(1 + 3 2)? | 


Les différents cas, k = 0, +1, correspondent à des sections spatiales euclidiennes 
(k = 0), à courbure (spatiale) positive (k = +1) ou négative (k = —1). 
L'indice topologique k s’appelle l’indice de courbure. Comme on peut le voir 
par comparaison avec la métrique de la sphère à trois dimensions, la géométrie 
spatiale est celle d’un espace fermé lorsque k = +1; par contre, lorsque k = 0 
ou -1, la géométrie spatiale peut être soit celle d’un espace ouvert, soit celle d’un 
espace fermé. L affirmation courante, selon laquelle l’ Univers est ouvert dès lors que 
k = 0 ou —1 est incorrecte : un espace à courbure constante nulle, voire négative, 
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peut parfaitement étre fermé [voir, par exemple, M. Lachiéze-Rey et J.-P. Luminet 
(1994)]. 

Autres métriques d’intérêt astrophysique 


Leffondrement gravitationnel d’une étoile vers un trou noir de masse M, de 
charge Q et de moment cinétique J fait apparaître l’intérêt de la métrique suivante : 


A J ? sin?@ J? Fal 
2_ +2 2 
ds* = 7 La sin eae] -77 fr + a) dy — Za 


p? 
= dr? — pP d8? , (8.111) 


où l’on a posé 


2 
Az r? — 2Mr + = +Q? (8.112a) 
2 = pty a cos? 0 (8.112b) 
p= We S ; 


La métrique (8.111) est la métrique de Kerr-Newman, dont les propriétés sont 
clairement résumées dans N. Straumann (1984) [voir aussi Ch. W. Misner et al. 
(1973)], et qui contient des cas particuliers trouvés précédemment [Q = J = 0 
(solution de Schwarzschild); Q = 0 (solution de Kerr); J = 0 (solution de 
Reissner—Nordstr6m)}. 

Une autre classe de métriques, d’intérêt cosmologique cette fois, est constituée 
par des modéles homogénes mais anisotropes, tels ceux de la forme 


ds? = dt? — X?(t)dx? — Y?(t)dy? ~ Z?(t)dz’, (8.113) 


où X(t), Y (t) et Z(t) sont trois fonctions du temps représentant, respectivement, 
l’expansion de |’ Univers dans les directions x, y et z. Cette expression caractérise 
les modèles de Bianchi de type I. Un cas particulier intéressant, la solution de Kasner 
(1921), est donné par 


X(t) = Xot” , Y(t) = Yot” , Z(t) = Zot? , (8.114) 
avec 
Pi + po + Ps = pi +p +73 = 1. (8.115) 


Cette solution représente un modèle d’ univers en expansion (un élément de 
volume dV croît avec le temps comme 1/|g|d%x = td°x) de manière anisotrope, 
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une ou plusieurs dimensions se contractant tandis que les autres se dilatent. 
Ces modèles homogènes et anisotropes sont étudiés en détail dans l’ouvrage de 
M.P. Ryan et L.C. Shepley (1975); une étude moins générale de ces univers 
mais portant davantage sur la solution de Kasner en relation avec le modèle du 
“mixmaster” [Ch. W. Misner (1969)] peut également être trouvée dans Ch. W. 
Misner, K.S. Thorne, J.A. Wheeler (1973). 


Les équations d’Einstein linéarisées 


Dans de très nombreux cas la variété d’espace-temps V^ est connue ainsi que 
sa métrique gf?) et l’on se pose le problème de connaître les “petites” perturbations 
hpv à la métrique, qu’ elles soient induites par de “petites” perturbations du tenseur 


énergie-impulsion ou non : 


Gu = go + hw 
(8.116) 
(0) 


el ff < Ihuel: 


Aussi l’équation à laquelle obéit la “petite” perturbation Apy est-telle l’équa- 
tion d’Einstein linéarisée, du moins si l’on néglige les termes !° en O (Ih). 


Le premier problème que nous rencontrons alors est le suivant : les décompositions 
précédentes du tenseur métrique sont-elles valables dans tout système de coor- 
données? Autrement dit, si l’on effectue un tel changement, le nouveau Ay est-il 


encore “petit”? En général, il n’en est rien et si l’on souhaite que |h,,| « | ge) 


et [hur]?  lhu| restent valables, il est nécessaire de limiter les changements 
de coordonnées admissibles. Dans cette section, nous nous bornerons au cas où la 
métrique g{2) est la métrique de l’ de Minkowski Nus : 

que giv est la métrique de l’espace de Minkowski 7, : 


Juv = Nv + uv. (8.117) 


Le second problème rencontré concerne la question de |’ élévation et de I’ abais- 
sement des indices : il est clair que, pour respecter la cohérence de I’ approximation 
linéaire utilisée, il est nécessaire d'élever et d’abaisser les indices à l’aide du 
tenseur métrique Ny; aussi les diverses grandeurs comportant des indices sont— 
elles des tenseurs par rapport aux transformations de Lorentz et non relativement 
aux changements de systèmes de coordonnées généraux. Notons cependant une 
différence d’ importance concernant le tenseur g’”, inverse du tenseur gn. On aura 


gh” # D NP gap (8.118) 


19. Ainsi que les dérivées; par exemple, |8,,hag|>>|O,he,|”, etc. 
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et, surtout, 


gt” z neY — h” + O (h?g) 3 (8.119) 


avec 
h” = t nP hap. (8.120) 


Dans ces conditions, et avec ces conventions, les symboles de Christoffel I ,, 
le tenseur de Ricci R, et le tenseur d’ Einstein G „y s’écrivent, respectivement, 


1 

15 = ae : [ahga + Ogher — ahap] (8.121) 
1 

Ruv = 9 [Ouvh = Onohy “ _ vahy | + Rav] (8.122) 
1 x ete ee 

Guv = 2 [uk ~ palv E vahy T huv] 


= Hi [Oh Ong?) . (8.123) 


Cette derniére équation peut étre simplifiée en posant 


-= 1 


hw = hw — zmwh, (8.124) 
où A est la trace du tenseur hu 
h = h” p = hap, (8.125) 
et Pon trouve 
1 = SA s 
Cw = 5 {Ch + TuvOaph? — koin} | (8.126) 


Finalement, les équations d’ Einstein linéarisées s’écrivent 
Ohau + Mur Oo RP — Aau hh = 164GT yy . (8.127) 


Notons qu’afin que cette dernière équation soit cohérente, il est nécessaire que 
le tenseur énergie-impulsion T,» soit lui-même de l’ordre de grandeur de h,,,. Il 
s'ensuit immédiatement que la relation de conservation V,T#” = 0 se réduit à la 
relation lorentzienne 0,T#” = 0, Comme Gp» est à divergence nulle, le membre 
de gauche de l'équation (8.126) est aussi à divergence nulle (identités de Bianchi 
linéarisées), ce qui entraîne O,T#* = 0. Ces quatre relations fournissent des 
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conditions relatives aux changements de coordonnées, que nous allons examiner 
maintenant. 
A cette fin, considérons un changement de coordonnées du type général 


ch — gt + e” (x) = r” (8.128) 


où e” (x) est une fonction arbitraire mais assujettie à ce que h, reste une grandeur 
“petite”, c’est-à-dire à ce que les relations (8.116) soient encore valables. La 
transformation (8.128) s’écrit, pour un 4-vecteur A“ 


Ox! 
mH m 
A Aa A 


= [n n + O,e"(x)] AP; (8.129) 


de même, la déviation h,,,, au tenseur métrique ny s’ écrit, dans ce nouveau système 
de coordonnées, 


lise = hyv a Ô(uEv) ; (8.130) 


de sorte que si h}, et hu» doivent être petits, tel doit aussi être le cas des dérivées 
Ô,E, (x) : tous les changements de systèmes de coordonnées ne conservent pas la 
“petitesse” de hu. Les transformations (8.128) sont appelées des transformations 
de jauge en raison d’une situation tout à fait analogue dans le cas électromagnéti- 
que 2°, 

Le tenseur huis dans une transformation de jauge, se transforme comme 


h = huw — ôu Er) + Nur 3a EÀ . (8.131) 


A ce point, rappelons que tous les indices correspondent à des indices lorentziens 
et que, par conséquent, l’invariance de Lorentz est manifeste tout au long de ces 
considérations. 

L’équation (8.127) est analogue à l’équation de Maxwell (5.24) pour les 
potentiels électromagnétiques; elle est, en outre, invariante dans les changements 
de jauge — de coordonnées ~ (8.128). La condition 7! 


ah! = 0, (8.132) 


dite condition de Lorentz, permet de restreindre les changements de coordonnées 
admissibles. En effet, imposer cette condition de jauge donne immédiatement 


0) REX = Ah — Oe = 0, (8.133) 


20. Voir, par exemple, S. Weinberg (1972) p. 257; Ch. W. Misner, K.S. Thorne, J.A. Wheeler (1973), 
p. 440, etc. 


21. Cette condition de jauge est parfois appelée “jauge de De Donder” ou encore “jauge harmonique”. 
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qui conduit à Oe” = 0. Cette condition est caractéristique des coordonnées 
harmoniques : les coordonnées harmoniques préservent la condition de Lorentz 
(8.132). 

Avec cette condition de jauge, les équations d’Einstein linéarisées s’écrivent 
maintenant 


Oh = 167G Tu , (8.134) 


dont la solution générale est de la forme 


D 2 fe rl 7 
OSR Sle (8.135) 


Z T, 
ħu (t,£) = ac fax w ( rT 
qui est tout a fait similaire 4 1a solution retardée des équations pour le 4—potentiel 
électromagnétique ?? en fonction du 4-courant. De manière analogue à ce dernier 
cas, la relation (8.135) explicite la propagation de l’action gravitationnelle d’un 
point de la source x’ au point x et ce, a la vitesse de la lumiére c = 1. 

L'intérêt des équations d’Einstein linéarisées est multiple. D’abord, elles per- 
mettent des calculs simples et des interprétations physiques assez directes lorsque 
les effets de la gravitation constituent de petites corrections à l’espace plat de la 
Relativité Restreinte, ce qui est bien le cas du système solaire. Ensuite, l’équa- 
tion (8.134), avec T;,, = 0, montre l’existence d’un rayonnement gravitationnel 
pouvant se propager même en l’absence de source : 


Ohy = 0. (8.136) 


Autrement dit, même dans le vide, le champ de gravitation peut ne pas être 
identiquement nul; l équation d’Einstien Gy = 0 possède des solutions différentes 


de guy = Nuw- 
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La théorie d’Einstein linéarisée précédente nous montre que de petites per- 
turbations gravitationnelles peuvent se propager à la vitesse de la lumière dans un 
espace-temps de Minkowski. En fait, on peut également montrer que de petites per- 
turbations peuvent se propager sur un espace courbe quelconque [voir, par exemple, 
A. Papapetrou (1974) ou Ch. W. Misner, K.S. Thorne, J.A. Wheeler (1973)], ce qui 
est illustré sur la figure 8.5. 

Ici, nous nous limiterons aux petites perturbations de l’espace de Minkowski, 
ce qui fournira un aperçu suffisant 2° 


22. Voir, par exemple, A.O. Barut (1964) ou C. Itzykson, J.P. Zuber (1980), etc. 


23. Une première approche, très simple, peut être trouvée dans P.C.W. Davies (1980); un exposé plus 
avancé est celui de K. Thorne (1983) tandis qu’une revue générale assortie d’une impressionnante 
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Figure 8.5 : Une onde gravitationnelle peut étre considérée comme une petite perturbation se propageant 
sur la variété d’espace-temps. 


L'importance des ondes et du rayonnement gravitationnels en astrophysique 
provient du fait que presque tout phénomène physique peut, à des degrés divers, 
en être la source : il n’y a pas de matière qui soit neutre gravitationnellement; 
l'effondrement gravitationnel d’une étoile, ou même le mouvement d’une planète 
autour d’un soleil, donnent lieu à des émissions d’ondes gravitationnelles. D’ores 
et déjà, le pulsar double PSR 1913+16 fournit la preuve de l’existence de telles 
ondes : les deux pulsars spiralent l’un vers l’autre en perdant de l’énergie émise 
sous forme de rayonnement gravitationnel, correspondant à celle calculée à l’aide 
de la Relativité Générale. Bien que les ondes gravitationnelles n’ aient pas encore été 
observées en laboratoire — leur amplitude est extraordinairement faible —, d’actives 
recherches expérimentales sont réalisées un peu partout dans le monde depuis 
plus d’un quart de siècle [J. Weber (1960) (1961) (1969)] et l’on pense pouvoir 
les détecter dans un avenir relativement proche. Ceci ouvrira alors la voie à une 
véritable Astronomie des Ondes Gravitationnelles nous permettant d’avoir accès 
aux tout premiers instants de Univers ou d’obtenir des informations sur toutes 
sortes de phénomènes invisibles autrement. 


1. Considérons donc la relation (8.136) assortie de la condition de jauge (8.132) 


Ohw = 0 
7 (8.137) 
Ouh” = 0, 
qui caractérise la propagation d’ondes de gravitation libres se propageant dans 
l’espace de Minkowski. Les ondes planes, du type 


huv = Aw es + Ares ; (8.138) 


sont solutions du système (8.137) pourvu que les amplitudes A „v, qui sont d’ailleurs 
des tenseurs (de Lorentz) symétriques, soient telles que 


bibliographie est due à K. Thorne (1989); on pourra également consulter N. Deruelle, T. Piran (1983) 
pour toutes sortes de problèmes et de recherches liés aux ondes gravitationnelles, ainsi que B. Carter et 
J.B. Hartie (1987). 
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k? Aw =O; (a) 
(8.139) 
ky AH” 


0 (b). 


Le tenseur A,,,,, étant symétrique, possède a priori dix composantes indépen- 
dantes; cependant, les quatre conditions de jauge fournissent quatre contraintes 
supplémentaires, réduisant ainsi le nombre de composantes indépendantes à six. 
Mais, d’autre part, l’invariance dans les transformations de jauge 


gh — x" = gh + e (x) (8.140) 


(quatre conditions) les réduit finalement à deux. Montrons-—le rapidement. Remar- 
quons d’abord que si l’on souhaite préserver le caractère d’onde plane à hy, les 
fonctions €” (x) se réduisent nécessairement à 


eX (2) = igh e the — jen en, (8.141) 


compte tenu de la relation Oe“(x) = 0 [cf. Eq. (8.133)] où les €” sont des 
fonctions infinitésimales de k. La transformation de jauge (8.140) donne alors 
[cf. Eq. (8.131)] : 


App ms À, = Ay + k(uËv) ce NuvkaË® (8.142) 


mais, comme À, satisfait encore la condition de jauge, on aura également 


0 = k, A = RPE =O, (8.143) 


qui n’est guère qu’une autre expression de Oe” (x) = 0. Nous allons maintenant 
utiliser ces diverses propriétés pour montrer explicitement comment le nombre de 
composantes indépendantes du tenseur A,,, peut être réduit à deux dans le cas 
d’une onde plane se propageant dans la direction Oz, c’est-à-dire, telle que son 
vecteur d’onde s’écrive, avec k = |k], 


k" = (k,0,0,k) ou ky = (k,0,0,—k): (8.144) 


Ceci ne restreint évidemment pas la généralité de la démonstration puisqu’il est 
toujours possible de trouver un système de coordonnées tel que (8.144) soit vrai. 
Dans ces conditions, et compte tenu de la relation (8.139b), on aura 


Ayo = Ày3 (u = 0,1,2,3). (8.145) 
La transformation (8.142) donnera alors 
Aloo = A400 + k(E° + £3) All = All 4 k(€° — £3) 


A'01 = Aol $ ke! A'12 = A (8.146) 
A'02 = 402 + ke? Al22 = A22 + k(€° — £3). 
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Ce systéme linéaire comporte six équations pour seulement quatre inconnues 
(€°, E1, €7, €3) que nous voulons déterminer afin de pouvoir simplifier la forme de 
A, (notons que À, et A, représentent la même situation physique). Ce système 
montre que la composante Aj n’est pas affectée par une transformation de jauge, 
aussi convient-il de la considérer comme l’une des composantes indépendantes de 
Au; il montre, en outre, que la combinaison A1! + 422 possède également cette 
propriété 


AT 4 Ar? = All + 42. (8.147) 


enfin €! et £? sont déterminés univoquement : 
ké! = Aol #4 Aor. ke? = A/02 = A°2 p (8.148) 


Finalement, on peut toujours choisir le 4—vecteur £” de manière que 


A’? —_ Alt 2 Ą'®2 = 0 = A! + Al22 4 (8.149) 


Dans cette jauge, le tenseur A,,,, s’écrit finalement 


0 0 0 0 
0 All Al2 0 
Au] = 0 A2 -A2 0 (8.150) 
0 0 0 0 
tandis que le tenseur hit se met sous la forme 
huv = Re {|en (+) + Beuy(x)Je**} , (8.151) 


où @ et 8 sont deux fonctions complexes arbitraires de k, tandis que e,,,,(+) et 
€uv (xX) sont les deux matrices de polarisation suivantes : 


00 0 0 
0 1 0 0 
le = 16 9 1 0 (8.152) 
06 0 0 
0 0 0 0 
00 1 0 
0 0 0 0 


La jauge précédente est généralement appelée (“jauge TT” pour “Transverse- 
Traceless”). 


2. Les deux modes possibles (8.152) et (8.153) de polarisation d’une onde 
gravitationnelle doivent maintenant être interprétés physiquement en examinant 
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l’effet d’une telle onde sur des particules-test. En réalité, un tel effet, sur une 
particule--test donnée, ne peut être apprécié que par rapport à une autre particule- 
test. Il convient donc d’écrire l’équation de la déviation géodésique pour la distance 
entre deux telles particules dans un système de coordonnées dans lequel À uv Obéisse 
à la jauge TT. 

Une approche plus simple [J. Foster, J.D. Nightingale (1979)] consiste à considérer une particule- 


test à l’origine des coordonnées et l’autre en {n“=(0,7)}, les deux particules étant initialement 
— i.e. avant le passage de l’onde — au repos. Elles sont alors séparées par la distance 


l= ]guvntn*|}/? 
= [lbih nn], (8.154) 
qui, à Paide du changement de coordonnées 
nén =n t ihin? , (8.155) 
se réécrit sous la forme 
t= nini]? + O(h?) , (8.156) 


ce qui indique que le vecteur « peut être considéré comme un vecteur-position dans l’espace usuel. 


Lorsque le vecteur « est parallèle à l'axe des z, on a k? = 7° car h? = 0 
icf. Eq. (8.150)] : si l’axe des deux particules-test est parallèle à la direction de 
propagation de l’onde, alors leur distance n’est pas affectée par son passage; une 
onde gravitationnelle est purement transverse. 


Si l’on choisit maintenant les deux particules dans un plan perpendiculaire à la direction de 
propagation de londe, c’est-à-dire &° donné par 


0 


petii- 3a coteta jt (8.157) 


pour le mode de polarisation + (a est donc considéré comme étant réel et positif par souci de 
simplicité), et par 

i iy) Os 8.158 

[le =Iin' la costk(e 2) IN fl (8.158) 


pour le mode noté X, on s’apergoit que le mouvement des deux particules est donné par la figure 
8.6. 


Si l’on appelle 7” le quadrivecteur qui joint l’une à l’autre les particules-test, 
l équation de la déviation géodésique, à laquelle obéit n”, peut se mettre sous la 
forme suivante (après linéarisation) : 


dn” j 

= RF cain (8.159) 
en se plaçant dans le repère au repos de la particule-test située à l’origine [donc 
u” = (1,0)] et en remarquant que I}, = 0. L’équation (8.159) se réduit alors à la 
suivante (à des termes du second ordre près) : 
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drt i . 
DE ~ Roost, (8.160) 


qui se réécrit sous la forme 


i 2pi 
r? 2 1 Oh; 


j 

a = 3 9p M (8.161) 
où l’on a utilisé le tenseur de Riemann linéarisé exprimée dans la jauge TT. Si l’on 
considère une onde gravitationnelle se propageant dans la direction des z > 0, 
c’est-à-dire telle que 


{ hi = —hoe = D, (t = z) 


8.162 
h2 = ha =ğ,(t-z2), ( ) 


on constate immédiatement qu’il n’y a pas d’ oscillation parallèlement à la direction 
Oz : h3 = 0 et l’on a alors 7° = 0. Les ondes gravitationnelles sont bien des ondes 
transverses. En outre, l'équation (8.161) admet alors les solutions (approchées) 


(7) =(B)-5aee-2 (4 AE (8.163) 
(a) =(B)—see-2(9 o) (a) 660 


obtenues par intégration approximative de l’équation (8.161) en supposant que 
les deux particules—test sont au repos avant passage de l’onde et séparées de ný; 
ces deux dernières relations, particularisées aux cas d’ondes planes périodiques, 
montrent l’effet physique sur des particules-test de ces deux modes de polarisation 
possibles [Fig. 8.6]. 


(a) (b) 


Figure 8.6 : Les deux modes d’oscillation d’une onde gravitationnelle sont illustrés par les variations 
des distances à l’origine (où se trouve une particule-test) d’un anneau fictif de particules-test 
[mode + : (a) : mode x : (b)]. 
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3. La discussion précédente suggère une possibilité de détection d’éventuelles 
ondes gravitationnelles : il suffit, en principe, de disposer de deux particules-test et 
de mesurer leur mouvement relatif. Cela peut être effectué de bien des manières et 
nous évoquerons pour commencer l’antenne gravitationnelle de J. Weber (1961), 
(1968), (1980), c’est-à-dire un système résonant [Fig. 8.7]. Dans la pratique, il est 
clair que l’on n'utilise pas de système tel que celui de la figure 8.7. mais toutes 
sortes de systèmes oscillants comme, par exemple, l’antenne de J. Weber, constituée 
d’un lourd cylindre métallique dont les modes d’oscillations peuvent être excités 
par le passage d’ondes gravitationnelles. 


Figure 8.7 : Détecteur résonant. Deux particules de masse m, liées par un ressort, forment une antenne 
gravitationnelle. 


Limitons-nous donc à l’antenne simplifiée de la figure 8.7. Remarquons d’abord 
que lorsque l’onde gravitationnelle se propage parallèlement à l’axe des deux 
masses, l’antenne ne réagit pas, compte tenu du fait qu’il s’agit d’ondes transverses. 
L’antenne apparaît donc comme étant directionnelle, le maximum de réaction étant 
obtenu lorsque l’onde se propage perpendiculairement à l’axe des deux masses. 
Nous nous restreindrons à ce dernier cas. 


Avec les notations déjà utilisées plus haut, équation de la déviation géodésique 
(des deux masses l’une par rapport à l’autre) s’écrit 


RE 0. 8.165 
ao + Igi + um ~ -gagari + Ol") (8.165) 
où wo est la fréquence de résonance de l’antenne et où y est le coefficient 
d'amortissement du système. Dans cette équation, 67’ est la variation de la distance 
entre les deux masses, lors du passage de l’onde, tandis que nå représente cette même 
distance avant ce passage : comme n° = ný + 67’ et que n’ est du premier ordre 
en h, nous avons négligé les termes du second ordre dans le membre de droite de 
l’équation (8.165). Cette équation est écrite dans un système de coordonnées (en 
jauge TT) locales de l’une des deux masses et l’on consultera Ch. Misner, K. Thorne 
et J.A. Wheeler (1973) pour une discussion plus approfondie. 

Considérons, à titre d'exemple, le cas d’une onde plane se propageant le long 
de laxe Oz (l antenne étant orientée ainsi qu’il est indiqué sur la figure 8.8) ayant 
la polarisation + et la fréquence w : 


hy1 = =h = Age ivt-s) 
(8.166) 
hig = ha = 0. 
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Figure 8.8 : Géométrie de l’antenne résonante de la figure 8.7. L'onde se propage selon l'axe des z. 


Introduisant la forme (8.166) dans l’équation de l’oscillateur harmonique forcé 
que constitue l’antenne, soit dans (8.165), et considérant uniquement le déplacement 
én dans l’axe des deux masses, il vient 


d? d 2 1 2 —iwt a2 
an on + Vgl" + wodn ne fA,e “sin Acos2y , (8.167) 


dont l’amplitude de la solution stationnaire s’ écrit 


tw? lA, sin? 6. cos 2p 


ôn(w) = (8.168) 


w? — we + tw 

Ainsi — et comme dans tout circuit oscillant ordinaire — selon la largeur de 
bande de l’antenne gravitationnelle on détectera soit un signal très piqué autour de 
la fréquence de résonance wo (cas d’un grand “facteur de qualité” Q = wo/27), 
soit, au contraire, et avec une amplitude moindre, tout un spectre de fréquences 
possibles. En pratique, l’utilisation d’une antenne gravitationnelle avec tel ou tel 
facteur de qualité dépend beaucoup de la nature (aléatoire ou non, piquée ou non, 
etc.) du signal que l’on entend détecter [voir Ch. Misner, K. Thorne, J.A. Wheeler 
(1973) ou K. Thorne (1980) (1989), par exemple]. 


Le premier détecteur construit sur ce principe est celui de J. Weber (1960) qui 
consiste en une “barre” — un cylindre — d’aluminium d’environ 1.5 tonne dont 
les modes de vibration sont excités par le passage de |’ onde [Fig. 8.9], et dont la 
déformation est mesurée à l’aide d’un transducteur ?4 quelconque. L’ oscillation du 


24. C'est-à-dire, à l’aide d’un système permettant de transformer des déformations mécaniques en 
signaux électriques. Il peut s’agir ici de céramiques piezoélectriques, de capaciteurs, etc. 
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cable de 


hélium 
liquide 


titane support 
antenne 
transducteur 


‘SQUID + 
‘électronique 


signal 


liquide 


Figure 8.9. : Schéma de principe du détecteur de Weber. Un lourd cylindre d'aluminium est suspendu 
à l'aide d'un câble et ses oscillations éventuelles sous |’ effet d’ondes gravitationnelles sont mesurées à 
l'aide d'un transducteur, le tout est enfermé — du moins dans les dernières versions (Rome) — dans une 
enceinte refroidie à très basse température [d'après E. Amaldi et al. (1986); reproduit avec l'aimable 
autorisation de la Società Italiana de Fisica]. 


cylindre dans son mode fondamental est alors assimilable à celle d’un oscillateur 
harmonique. 


Ces mesures sont extrêmement délicates à mettre en œuvre, eu égard à la faiblesse 
des énergies mises en jeu par le passage d’une onde gravitationnelle (pour une onde 
très intense, telle qu’elle se produit lors d’une explosion de supernova au centre de 
la Galaxie, une énergie typique est de l’ordre de 107% J; !’ amplitude de l’onde est 
elle-même de l’ordre de 10718 et le déplacement 67 inférieur de plusieurs ordres 
de grandeur à la taille d’un proton!). Les très faibles amplitudes des variations 
de longueur de la barre de Weber exigent des mesures très soignées des signaux 
fournis par les transducteurs et des analyses complexes pour l’extraction du signal 
de tout le bruit existant (bruit thermique dans le cyclindre 2°, bruit de l’électronique, 
etc.). Pour diminuer ces incertitudes °° diverses, il faut refroidir l’antenne [voir, par 
exemple, E. Amaldi et al. (1986)] le plus possible (en pratique, à la température de 
l’hélium liquide, soit ~ 4°K) et/ou utiliser un monocristal de grande taille. 

Quoi qu’il en soit de ces divers perfectionnements, on atteint assez vite la “limite 
quantique” : les énergies mises en jeu par le passage d’une onde gravitationnelle 
sont si faibles que le changement dans l’énergie de la barre est de l’ordre de celle 
de quelques phonons! Si Egrav désigne l’énergie cédée par l’onde au détecteur, on 
doit avoir Egrav > wo. Cette énergie est de l’ordre de 


Exav ~ SMe, (8.169) 


25. A la température ambiante, le mouvement de la barre dû au bruit thermique est de l’ordre de 
Lbruit~(2keT/Mw2)/2~107!4em et l'énergie correspondante est de l’ordre de 107°3 J... 

26. Voir, par exemple, les articles de V.B. Braginsky, J. Weber, W.M. Fairbank, W.M. Fairbank et al., 
dans B. Bertotti (1974); voir aussi F. Everitt (1975). 


246 La gravitation relativiste d’Einstein 
où M est la masse de l'antenne et v la vitesse induite par I’ onde, c’est-à-dire 


v ~ whe. (8.170) 


On a donc finalement 
hmin > (wo M). (8.171) 


Pour une antenne perfectionnée, on doit avoir Amin > 107%, En fait, cette limite 
quantique n’est peut-être pas infranchissable car, en dernière analyse, une variable 
quantique peut toujours étre mesurée avec une précision arbitrairement grande a 
condition que, simultanément, la variable conjuguée le soit avec une précision 
arbitrairement faible : c’est ce que nous enseignent les relations d’incertitude. 


miroir de renvoi 


miroir de miroir d'entrée 


recyclage 


isolateur C = séparatrice 


To 

SIGNAL | 
Figure 8.10 : L’interférométre de Michelson utilisé comme détecteur d’ondes gravitationnelles. 
Afin d'obtenir un effet important, il convient de disposer de bras de grande longueur : ceci est obtenu 


à l’aide de réflexions multiples [d'après J.-Y. Vinet et al. (1990); reproduit avec l'aimable autorisation 
de l'éditeur et de l'auteur]. 


Un autre type de détecteur d’ondes gravitationnelles, à l’étude à l’heure actuelle, 
est constitué par un grand interféromètre (Michelson ou Fabry—Perrot). Celui-ci est 
formé [cas d’un Michelson; Fig. 8.10] de trois miroirs dont deux sont liés : deux des 
miroirs sont liés à des masses importantes, librement suspendues, et sont situés aux 
extrémités des deux bras du Michelson [cf. Chap. 1]; un miroir semi-transparent, 
habituel dans ce genre d’appareillage est destiné à réfléchir (et à laisser passer) un 
faisceau de lumiére cohérente émis par un laser. Entre les deux faisceaux existe alors 
une différence de chemin optique et leur recombinaison donne lieu à des franges 
d’interférence décelées dans un détecteur. Lorsqu’une onde gravitationnelle passe 
au travers de l’appareil, en général l’un des bras se contracte tandis que l’autre se 
dilate, modifiant ainsi le chemin optique des faisceaux et déplaçant par conséquent 
les franges. Cependant, compte tenu de la petitesse extrême des déplacements 
des miroirs, il est nécessaire de disposer de bras très longs (par exemple, afin de 
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pouvoir détecter une onde de fréquence 1 kHz, la longueur des bras nécessaires est 
de l’ordre de 100 km). Cela est atteint à l’aide de réflexions multiples sur des miroirs 
secondaires et l’on est ramené à des distances réelles de l’ordre du kilomètre. 

4. Examinons maintenant comment les ondes gravitationnelles peuvent être 
émises et avec quelle amplitude. Considérons donc de la matière caractérisée 
par le tenseur énergie-impulsion Tu, suffisamment concentrée pour qu’à l'infini 
l’espace-temps soit minkowskien et suffisamment peu dense pour que les équations 
d’Einstein linéarisées soient valables. Dans ces conditions, l’équation (8.134), écrite 
en jauge de Lorentz 


Ohyy = 167GT» , (8.134) 
et sa solution retardée (qui ne comporte donc que des ondes sortantes) 


Ty (t — |x — x’|,x’) 


LD = s RR i 
E E Te J dx ao (8.135) 
sont utilisables. Strictement parlant, il faudrait ajouter à 7),, la contribution des 
ondes gravitationnelles elles-mêmes mais, eu égard à sa petitesse, nous n’en 
tiendrons pas compte ici. 

Si l’on désigne par r = |x| la distance à l’origine, et si la matière y est 


sensiblement concentrée, la solution (8.135) peut être approchée par 
hult, r) ~ e [ert —r,x’) (8.172) 
loin de la source, c’est-à-dire dans la zone d’onde. Remarquons d’abord que ho, 


ne dépend pas du temps et ne saurait donc contribuer aux ondes gravitationnelles : 
en effet, en raison de la conservation du tenseur énergie—impulsion, on a [Chap. 3] 


J dL T” = const. 


= f aar” . 


Il est donc possible de se limiter à la partie spatiale de hi, soit hij. Utilisant 
maintenant la relation de conservation 0,7” = 0, détaillée sous la forme 


HT” + TE = 0 (8.173a) 
OT” + GT = 0, (8.173b) 
on trouve, aprés quelques calculs, 
_ IG g 
hi;(t,r) = PE dxp(t—r,x)t:T; (8.174) 


r de 
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où p est la densité de masse de la source (p = Too) et où l’on a supposé que les 
mouvements au sein de cette derniére sont des mouvements lents. Cette hypothése 
revient (i) à ne pas considérer la contribution de l’énergie due aux mouvements 
internes et (ii) à ne considérer que la contribution de la densité de masse de la 
source. Ainsi p est la densité de masse propre. La relation (8. 174) a été obtenue 
pour la première fois en 1918 par A. Einstein. 


La relation (8.174) peut être démontrée comme suit [J. Foster, J.D. Nightingale (1989)]. Partant de 
l'identité 


J @2a(T*25)=f Poo Tai f Par , (8.175) 


dont le membre de gauche est nul (utilisation du théorème de Gauss et du fait que la source est 
spatialement limitée) et utilisant la relation de conservation (8.173b), il vient 


f @eT#=34 f PaT +Tiozt). (8.176) 
D’autre part, le théorème de Gauss nous donne encore 
f 22d, [T° x2] =0, (8.177) 
de sorte que le membre de droite de la relation (8.176) s’écrit 
+ f BaTh TO gi) = Jar g (8.178) 
où l’on a également utilisé la relation de conservation (8.173a). D’où, finalement, la relation (8.174). 


L'expression (8.174) pour hij fait intervenir la dérivée (temporelle) seconde 
de ce qui apparaît comme le moment d’ordre deux — c’est-à-dire le moment 
quadrupolaire — de la distribution de masse de la source. Examinons cela d’un 
peu plus près en comparant avec le cas des ondes électromagnétiques usuelles qui, 
elles, font intervenir la dérivée seconde du moment dipolaire de la distribution de 
charge de la source. Remarquons d’abord que le passage de la loi de Coulomb à la 
loi d’attraction universelle peut être effectué à l’aide de la substitution e? > —m?, 
de sorte que si la puissance électromagnétique rayonnée [J.D. Jackson (1962)] est 


233 2E N 
E= Erez (Za ; (8.179) 
où y est leur accélération totale et d le moment dipolaire 
d = ex, (8.180) 
£ 


on pourrait s’attendre que la puissance rayonnée par une source gravitationnelle 
soit tout à fait similaire. En fait, il men est rien car si Pon examine le moment 
dipolaire d’une distribution de masse, soit 


d=S mx, (8.181) 
£ 


on s’apercoit facilement que d = 0! En effet, 
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Sa = 2 me De = impulsion totale = const. , 
dont la dérivée est nulle. On s’apercevrait, de même, que I’analogue gravitationnel 
du rayonnement dipolaire magnétique de l’électromagnétisme est également nul, 
en raison de la conservation du moment angulaire de la source [Ch. Misner, 
K. Thorne, J.A. Wheeler (1973)]. Le rayonnement gravitationnel est donc au moins 
quadrupolaire : ainsi une source à symétrie sphérique, même non statique, ne peut 
émettre de rayonnement gravitationnel. 

5. Des considérations précédentes, il résulte que presque tout phénomène phy- 
sique produit des ondes gravitationnelles ! Cependant, on s’attend à une production 
notable seulement dans le cas d’objets astrophysiques : explosions de supernovae, 
systèmes binaires, collisions d'objets stellaires, etc. En fait, les estimations que 
l’on peut effectuer sur la production d’ondes gravitationnelles, dans le cadre de 
tel ou tel phénomène, reposent essentiellement sur des modèles purement théori- 
ques des objets astrophysiques considérés. Par exemple, on admet qu’une étoile à 
neutrons se forme par implosion ?7 du cœur d’une supernova, par ailleurs en explo- 
sion; cela exige des modèles spécifiques dans lesquels interviennent toutes sortes 
de phénomènes physiques dont la description théorique n’est pas toujours assurée 
(équation d’état de la matière dense, etc.), et qui n’ont pas encore conduit tout à 
fait à la simulation de la formation d’étoiles à neutrons. Tout ceci est discuté en 
détail 8 par K. Thorne (1989). 

La figure 8.11, inspirée de K. Thorne (1980), donne une idée des amplitudes 
auxquelles on peut s'attendre — sur la base de modèles astrophysiques plus ou 
moins acceptés à l’heure actuelle — pour diverses fréquences d’ondes gravitation- 
nelles. Parmi les phénomènes considérés, on trouve (i) divers phénomènes explosifs 
[supernovae, tremblements du cœur d’étoiles à neutrons, effondrement 28 gravita- 
tionnel d’une étoile en un trou noir, effondrement d’un système binaire, etc.], (ii) 
des systèmes périodiques (systèmes binaires, rotation d’étoiles à neutrons ou de 
naines blanches déformées, etc.), (iii) un fond aléatoire d’ondes gravitationnelles 
primordiales (i.e. créées avec l’ Univers lui-même) ou formées lors de l’effondre- 
ment gravitationnel d’éventuelles étoiles de population ?° HI. Des diagrammes plus 
détaillés, selon les phénomènes considérés, peuvent être trouvés dans K. Thorne 
(1989) et dans les références citées par cet auteur. 

Un ordre de grandeur de l’amplitude d’une onde gravitationnelle, de fréquence 
w, peut être obtenu en considérant la relation (8.174). En effet, on a à peu près : 


2G 
h ~ SMR, (8.182) 
r 
27. L'effondrement du cceur doit être asymétrique. 


28. Un exposé simple peut être trouvé dans M. Tinto (1988). 
29. Supposées s’être formées avant les galaxies. 
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Figure 8.11 : Estimations des amplitudes des ondes gravitationnelles en fonction de leurs 
fréquences pour divers processus astrophysiques {d’après K. Thorne (1980) ]. 


où, pour une onde plane de fréquence w, la dérivée temporelle seconde donne lieu 
au facteur w?, où R est la taille de la source et M sa masse. Le facteur € traduit 
l’asymétrie de la source. Toutefois, wR ~ v est une vitesse caractéristique des 
mouvements internes de la source et comme 


GM 
2 ee 
Po, (8.183) 


on aura l’estimation (grossière) suivante [M. Tinto (1988)] : 


he (=+) ; (==) ~e (==) l Ey. (8.184) 


Cette relation montre clairement à quelles conditions doivent obéir les sources 
d'ondes gravitationnelles pour pouvoir constituer des émetteurs efficaces : leurs 
tailles doivent être aussi proches que possible de leur rayon de Schwarzschild 
(R & Rgcn.); elles doivent être très relativistes et enfin être aussi asymétriques que 
possible. 

6. Concrètement, la meilleure preuve actuelle de l'existence des ondes gravi- 
tationnelles ne provient pas de leur éventuelle détection mais plutôt de l'étude du 
pulsar double PSR 1913+16 [J.H. Taylor, J.M. Weisberg (1982) (1989)] : celle-ci a 
atteint un tel degré de précision que la perte d’énergie du système due à l’émission 
des ondes gravitationnelles peut être évaluée et comparée à celle donnée par la 
formule d’Einstein (1918). Nous allons en donner ici un aperçu rudimentaire, une 
idée plus précise étant fournie ailleurs [voir, par exemple, K. Thorne (1989)]. Il est 
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clair que cette déduction n’est pas suffisamment correcte pour que cette formule 
puisse être utilisée valablement dans le cas de ce pulsar. 

La première question qui se pose est celle de l’énergie des ondes gravitation- 
nelles émises. Compte tenu des équations du champ (8.137) auxquelles obéissent 
les composantes huv (toujours en jauge TT), le tenseur énergie—impulsion corres- 
pondant est nécessairement [Appendice C] proportionnel à 30 


TSR! x 1 dahun Ogi ; (8.185) 


où, pour des raisons dimensionnelles, la constante de proportionnalité est néces- 
sairement en GT}. Cette relation montre que l'énergie contenue dans une onde 
gravitationnelle est a priori du second ordre; elle est donc négligée dans la théorie 
linéarisée. Les équations d’Einstein écrites au second ordre pour des ondes libres, 


Gu = GY) + GP =0, (8.186) 


montrent que c2 peut être considéré comme — 167G fois le tenseur énergie— 
impulsion de l’onde gravitationnelle linéaire. On trouve finalement [voir, par 
exemple, S. Weinberg (1972)] : 


pes = =g g Pw- OP hey , (8.187) 
qui se réécrit sous la forme 
kk? 
cute =a lal +14? (8.188) 


dans le cas d’une onde plane de vecteur d’onde k“, du type (8.151). 

A ce stade, il est os de remarquer que les expressions précédentes 
(8.185) et (8. 186), pour T Lae n’ont pas de sens physique direct; en effet, l énergie 
gravitationnelle 3! ne saurait être localisée et se trouve répartie a priori sur tout 
l’espace-temps : il n’y a pas de force gravitationnelle exercée en un point! Aussi 
doit-on remplacer les relations précédentes par des moyennes prises sur quelques 
longueurs d’onde; ainsi, la relation (8.186) doit se lire 


1 p puv 

TePo = 3G < huv OPR” Dos (8.189) 

La densité d’ énergie [ou le flux d'énergie (i.e. P énergie par unité de temps et de 

surface) à un facteur c près] s’ écrit finalement, pour une onde plane se propageant 
selon l’axe des x, 


30. Nous avons négligé le terme en nag L; ce terme est, en effet, nul pour des superpositions d’ondes 
planes obéissant aux équations du mouvement. 


31. Nous avons vu plus haut qu’une onde gravitationnelle excite les modes d’oscillation d’un détecteur : 
elle lui communique donc de I’ énergie et de l’impulsion. Une onde gravitationnelle posséde donc malgré 
tout un contenu énergétique, 
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1 d 2 i/d d 4 
On ees Ek ieee 
onde ~ 16rG ($ 2) F À Ge Shaa) | (8.190) 


En utilisant maintenant l’expression approchée des h;; donnée par la relation 
(8.172) ou (8.174) et en intégrant le flux d’énergie sur une surface entourant la 
source, on obtient 3? [voir, par exemple, S.L. Shapiro et S.A. Teukolsky (1983)] la 
puissance rayonnée sous forme d'ondes gravitationnelles, 


dE G Qy BQ* 


= ` 8.191 
d 5 dt eto) 
où Qi; est le moment quadrupolaire défini par 
Qy = | Polani = 276). (8.192) 


C’est la formule d’ Einstein (1918) dont on trouvera les détails de la démonstra- 
tion, par exemple, dans L. Landau et E. Lifschitz, etc. La relation (8.190) montre 
que pour un système oscillant, de fréquence w, cette puissance est en wô, 

Un exemple utile d’émetteur d’ondes gravitationnelles®? est constitué par un 
systéme binaire, tel le pulsar double PSR 1913+16. Ici, nous nous limiterons 4 deux 
étoiles ponctuelles, de masses m1 et m2, en orbite circulaire l’une autour de l’autre. 
On a donc affaire à un système possédant un moment quadrupolaire dépendant du 
temps, émettant par conséquent des ondes gravitationnelles. Il s’ensuit que les deux 
étoiles spiraleront lentement l’une vers l’autre pour finir par s’effondrer l’une sur 
l’autre. Examinons cela d’un peu plus près. Si £1 et £2 désignent les distances des 
deux étoiles à leur centre de gravité situé à l’origine, les parties dépendant du temps 
des différentes composantes du moment quadrupolaire s’obtiennent sans difficulté 
à partir des équations des trajectoires des deux étoiles, 


zı = —X2 = Lcoswt 
(8.193) 
YU = —-Y = {sinwt 
où £ est leur distance et où w est la vitesse angulaire 
GM \'/2 


32. La démonstration n’est valable que pour un système comportant des tensions peu importantes, 
faiblement autogravitant, et dont les vitesses sont petites comparées à celle de la lumière. En outre, 
même étendue à des sources qui ne satisfont pas à ces conditions, il subsiste de délicats problèmes dans 
l'application de ces relations au pulsar binaire PSR 1913+16, compte tenu de ce que GM/Rc?~.2. 
[Nous sommes redevables de ces remarques 4 MM. L. Blanchet et T. Damour dont on pourra consulter, 
par ailleurs, l’article paru dans N. Deruelle et T. Piran (1983).] 
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(M = m1 + me) qui résulte de légalité entre l’attraction gravitationnelle et la 
force centrifuge dans le cas de mouvements circulaires. On trouve alors 


Qu = —Q22 = 3 uÊ cos2wt + const. 
(8.195) 
Qu = Qa = $ uê sin Qwt + const. 
où p est la masse réduite 
mim. 
= ———— . 8.196 
rs (8.196) 


Insérant maintenant |’ expression (8.195), après l’avoir dérivée trois fois, dans la 
relation (8.191), il vient 
dE 32 G* Mey? 
= es (8.197) 
dt 5 & Ø 
où nous avons rétabli les facteurs c. Compte tenu de ce que la période de rotation 
T = 27 /w est donnée par l’équation (8.194), on obtient 


147 _314 
T dt 2£dt 
3 1 dE 96 G? M?y 
où l’on a utilisé le fait que l’énergie du système est 
= -3 CuM ; (8.199) 


Intégrant l’ équation différentielle pour £(t) [Eq. (8.198)], on constate que lorsque 
t tends vers to, &(¢) tends vers zéro — il y a donc “coalescence” des deux étoiles — 
et Pon trouve 


ze ø l 

— 256 G3 M?p’ 
où £9 est la distance initiale des deux étoiles. Appliquée aux données du pulsar 
double PSR 1913+16, la relation (8.198) est plus ou moins vérifiée; une fois corrigée 
de l’excentricité de la trajectoire, elle le devient tout à fait! Ce seul fait démontre 
l'existence des ondes gravitationnelles. 


to (8.200) 


EXERCICES 


1. On considère les équations d’Einstein dans un espace-temps à 2+1 dimensions. Combien le tenseur 
de Riemann (%) R;;k1 possède-t-il de composantes indépendantes ? Combien en possède la contraction 
(3) R;; ? En déduire qu’un espace-temps à 2+1 dimensions tel que ©) R;;=0 est nécessairement plat. 
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2. Montrer que les équations d’Einstein peuvent se mettre sous la forme : 


Ryuv= 8rG ÎTuv- 4 uv TÀ] i 


3. Ecrire puis résoudre, en coordonnées de Schwarzschild, les équations d’Einstein avec le terme 
cosmologique, dans le vide. On trouve 


ds?=(1-2GM -4 xr?) dt?=(1-2GM _ 3 yr?) "ar? 77a? 


Evaluer l'avance du périhélie d’une planète à l’aide de cette métrique. Sachant que l'avance du 
périhélie de Mercure est de 43.11” +.45”, quelles limites peut-on obtenir sur À? 


4. (i) Calculer le tenseur de Riemann pour la métrique à symétrie sphérique la plus générale et (ii) 
en déduire que, dans le cas de la métrique de Schwarzschild écrite en coordonnées standard, ce tenseur 
n’est pas singulier au point r=2GM. 


5. A l’aide du théorème de Birkhoff, montrer qu’une particule-test située à l’intérieur d’une sphère 
creuse ne subit pas d’action gravitationnelle. 


6. La géométrie d’une étoile à symétrie sphérique est décrite par la métrique 
ds? =e?*dt? — e*4dr* — r7d? , 


et la matière est supposée isentropique (i.e. dS=0). Le tenseur énergie-impulsion du fluide qui la 
compose est de la forme “fluide parfait” 


THY =(pt+P)ubu” — Pg” . 
(i) Montrer que la conservation de T#”, soit V, 74" =0, entraîne 
d{p/n}=-—Pdfi/n], 
où n est la densité de baryons qui composent l'étoile (notons que V,, J“=0), c’est-à-dire encore 
dp = be dn. 
(ii) Ecrire explicitement l’équation d’Euler décrivant le fluide [on trouve 
(p+P)u” V pur +V pu PHU” V, Peu, =0). 


(iii) Dans le cas d’une étoile statique, montrer que l’on a alors 


LEO = I(r) + P(r Zr) . 


7. Montrer que, dans un Univers de Friedman, la conservation du tenseur énergie-impulsion, 
Va T#” =0, entraîne 


d(pR?)+ PaR?=0. 
8. Montrer que, dans un repère synchrone, o,,, =0 entraîne 
3ogij = 4 9ij0,u" . 


9. On considère l’espace de Minkowski M avec sa métrique habituelle 


ds? = dt? ~ dx?. 
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(i) Ecrire cette métrique dans le système de coordonnées hyperboliques (r,r,8,4) où t=rchx, 
r = TShy avec r/t=thx et t?—-r? 

(ii) Identifier alors la métrique obtenue à une métrique d’espace de Friedman avec un facteur 
d'échelle R(r)=r(r>0). Quelles sont les lignes d’univers des galaxies? Trouver les trajectoires des 
photons. : 


(iii) Quelle est la courbure de cet espace-temps (univers de Milne)? A quel tenseur énergie— 
impulsion correspond-il ? 


=r". 


10. Soit A,,, l'amplitude d’une onde gravitationnelle hy, 
huv = Re Any er ; 


considérée dans la jauge TT (on supposera que l’onde se propage le long de l’axe des z) et soit R(x) 
une rotation d’angle x autour de l’axe des z. Ecrire explicitement R(x) puis trouver la forme du tenseur 
Av après cette transformation. 


11. Montrer que dans la jauge TT on a rho =0 et Tea sae. 


12. Ecrire l'équation des géodésiques pour une particule-test soumise à l’action d’une onde 
gravitationnelle dans la jauge TT. Quelles conclusions peut-on en tirer? 


13, Démontrer les relations (8.159) à (8.161). 


14, Calculer l’effet d’une onde gravitationnelle de fréquence w, de polarisation transverse (x) et se 
propageant dans la direction z>0, sur l'antenne dont la géométrie est fournie par la figure 8.8. 


15, Démontrer la relation (8.174) selon le schéma (8.175) — (8.177) [on utilisera les relations de 
conservation (8.173) et le théorème de Gauss]. 


16, Montrer que le tenseur TË”, [Eq. (8.187)] est invariant de jauge. 


onde 


17. Calculer le tenseur d’Einstein G, au second ordre en h et Gh. En déduire la forme de Toe 
[S. Weinberg (1972)]. 


APPENDICE A 


Généralités sur les tenseurs 


Au cours du chapitre 3, nous avons “défini” les tenseurs de maniére empirique, 
sans leur donner un sens mathématique précis. Nous avons aussi insisté sur les 
positions exactes des indices et sur les notations utilisées. Celles-ci sont tout à 
fait cohérentes et l’on s’en rend compte immédiatement lorsque l’on interprète les 
tenseurs d’un point de vue un peu plus mathématique. 

On trouvera un exposé plus détaillé de ce qui suit sur les tenseurs dans divers 
ouvrages !. 

Dans cet appendice, nous rappellerons rapidement la notion de dual d’un 
espace vectoriel puis donnerons une définition mathématique pour les tenseurs 
et, notamment, pour les tenseurs affines; enfin nous indiquerons quelques critères 
de tensorialité. 


Dual d’un espace vectoriel 


Soit E un espace vectoriel sur C quelconque (R”, C”, M , etc.). Une forme 
linéaire sur E est une application linéaire de E dans C. 


Exemples : — 
(1) f*(x)=2* est une forme linéaire sur C”. 


(2) Soit E l’espace vectoriel des fonctions numériques continues sur [0,1]. Les applications suivantes 
sont des formes linéaires : 


æ(t)}—z(to) avec t0€{0,1] 


a(t)— f a(t) dt. 


(3) Soit E=C” et AEL(E,E) une application linéaire de E dans lui-même. Alors Tr.A est une 
forme linéaire. 


(4) Soit E l’espace vectoriel des suites numériques convergentes. L’ application qui à une suite { Sn} 
fait correspondre sa limite S est une forme linéaire. 


1. Voir, par exemple, A. Lichnerowicz, Algébre et analyse linéaires (Masson, Paris, 1970); A. Lich- 
nerowicz, Eléments de calcul tensoriel (Gabay, Paris, 1987). 
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Définition : L'espace vectoriel L(E, C) des formes linéaires sur E est appelé 
l’espace dual de ¥ et on le note E*. Si dim. E =n alors dim. E* = n. 


Soit maintenant {ei}i=1,2,..n une base de E supposé de dimension n. Soient 
maintenant les formes linéaires e*!, e*?, ...e*” définies par 


e“(e;) = 6"; 


[on remarquera que pour chaque x de E, e**(x) = zê, où zê est la composante 
contravariante de x dans la base des {e}]; on démontre alors facilement que les 
{e*t} constituent une base de E*, la base duale de {e;}. 

Soient {e;} et {e!} deux bases de E et soit R la matrice de passage : 


e; = Ri’ ej ; 


si x est un vecteur de E, on a x = zte; = x" e;, ce qui entraîne immédiatement 


r = R'a”. 


Autrement dit, les composantes contravariantes de x dans la nouvelle base 
s’obtiennent à l’aide de la matrice R71. 

Lorsque dim.E =n, il est aisé de démontrer que toute forme linéaire sur E, 
supposé muni d’un produit scalaire noté <, >, peut s’écrire sous la forme 


y*(x)=<y,x>, 


où x, y sont des éléments de E et où y* est un élément de E*, associé de manière 
univoque à y. 


Produits tensoriels d’espaces vectoriels 


Soient deux espaces vectoriels E et F de dimensions finies : dim.E=n et 
dim.F=m. Nous allons définir un espace vectoriel à mn dimensions, noté E @ 
F, en munissant E x F d’une structure ad hoc. Au couple (x,y) avec x dans 
E et y dans F, nous ferons correspondre un élément de E @ F, noté x @ y, la 
correspondance jouissant des propriétés suivantes : 

G) x8 (yı +72) = x ® y1 +x® y2 

(xı +X2)@y=xi@y+x2.®y 
(et ce, quels que soient les vecteurs, x, X1, X2, de E et y, y1, y2 de F); 

Gi) a(x @y) =ax@y =x@ay; 

(iii) si {e;} et {fj} sont des bases de E et F respectivement, alors les nm 
éléments. 


€i 8f; = E;j 


forment une base E & F. 
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On peut donc écrire 


x®@y=2r ye, Q fj = rt yl £ij ; 
ainsi les x° y? sont les composantes contravariantes du tenseur x & y dans la base 
£ij. Bien entendu, on peut effectuer également le produit tensoriel d’un espace 
vectoriel par le dual d’un autre espace vectoriel. Ainsi, en considérant les espaces 
vectoriels E, E*, F et F* on pourra former les produits tensoriels suivants : 


E@F,E@F*,E*@F*,E*@F,E@E*,... 


dont les éléments auront respectivement les formes générales 
T =T%e,® f; 
T' =T",e,@f* 
T” = Ti e* Q f*i 
T* = 1 eig f; 


Ty a pun f e; Q et 
On conçoit donc mieux ce qu’exprime la position des indices d’un tenseur d’ ordre 2. 
Ayant défini le produit de deux espaces vectoriels, il est maintenant possible de 
former des produits tensoriels comportant un nombre arbitraire d’ espaces vectoriels. 
Par exemple, E, F et G étant trois espaces vectoriels, de dimension finie, on peut 
former EQF puis (E @ F) @ G qui est par construction E @ F & G. Les éléments 
de cet espace vectoriel sont les tenseurs d’ ordre 3 et sont de la forme 


T = Te; @f, 8 Ek. 
Un tenseur affine attaché à un espace vectoriel E est un élément de l’espace 
vectoriel 


EQE@...@E@E*@E*@...@E*=T; 


p fois q fois 
ce sera un tenseur d’ordre p + q qui sera p fois contravariant et q fois covariant. 
Dans la suite, nous nous limiterons aux tenseurs afines : en Relativité Restreinte 
nous ne considérons que les tenseurs affines sur l’espace de Minkowski M. En 
outre, on a dim.T = n?t9, 
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Etudions maintenant les changements de base pour les composantes d’un tenseur 
affine; soient T#1/#2""#? ces composantes : le tenseur considéré est donc un élément 
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de E®?. Soient {e;} et {e!} deux bases différentes de E et soit R la matrice de 
passage, d’éléments R,/ 
e; = RP e; 


La base de E®?, soit {e;, Q e; ®... Q €; }, va devenir 


4 t t R, AR, 3 „Íre, a ; 
e; 8e @...@e, = Ry Ri, Ry re; Qe @... ej, 
qui peut encore s’écrire 


/ — R, Hp, 32 pre en le 
Cisig vip T Ri, By... Ri P € 5152-50 


où les notations sont évidentes. Dans ces conditions, l'expression du tenseur T 
4 + à 
dans les deux bases {€;, i... } et {€%,:,., } Conduit à 


— T'hil2.Hp g; 3 
T =T P Eiiz...ip 


= TM1Y2.-Up e. ee 
112--.tp 


et finalement a 
Piva Up — (RY) vi (A va (Re Vp HIV? -Hp | 
Introduisons la notation 
(RE = RY; 


la loi de transformation des composantes contravariantes du tenseur T se réécrit 
sous la forme plus simple 


T'hib2.Up — PHI H Rr PAET Rep a Tir Vp | 
Quant aux composantes covariantes, on montre facilement qu’elles se transforment 


comme 


i = Vy v2 Vp à 
Tis wa--tp a Ru Ho °° -Ru, Tv, ’ 


ainsi les composantes mixtes — i.e. contra- et covariantes — d’un tenseur s’écriront 


! aa QQ... 
Dee RS R ai Ra P Ry Aai Ta gaas 
Une notation très utile est la suivante : on pose 


4 i 
I de = ee 
pare Viva. = Thike AZUR 


(Ra = Re, 


R,° 


i 
X 

¥ 
R 
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avec Ces conventions, ona 


et 
RY „ R° yo 6E př 


La loi de transformation des composantes mixtes d’un tenseur — d’ordre 2, à 
titre d'exemple — s’écrira 


TH „= R" a RÊ Ts. 


En résumé, les indices primés correspondent aux composantes de T dans la nouvelle 
base. 

On obtient alors sans problème [A. Lichnerowicz (1970)] les critères de tenso- 
rialités suivants. 


Théorème : Pour qu'un système de m’ quantités T™"?--*« attachées à une 
base {ei, Q ei, Q . . . Q ei, } de l'espace E®4 (dim. E = m) puisse être considéré 
comme le système des composantes contravariantes d’un tenseur déterminé, il faut 
et il suffit que, dans un changement de base quelconque, ce système se transforme 
selon les lois données plus haut. 


Corollaire : Pour qu’un système de mî quantités T'Ÿ2Ÿa attachées à une 
base {ei ei, 8...8 ei, } de l’espace ES (dim. E = m) puisse être considéré 
comme le système des composantes contravariantes d’un tenseur déterminé, il faut 
et il suffit que, quels que soient les vecteurs X(1),X(2),..-X(q) de E, la grandeur 
T2991); £(2)ig ++ L(q)ig reste invariante par changement de base. 


APPENDICE B 


Formes différentielles 
extérieures 


Dans cet appendice, nous nous limiterons, de maniére pragmatique, 4 des 
notions tout à fait élémentaires destinées à être utilisées dans l'intégration 
de diverses grandeurs physiques (courants, tenseur énergie-impulsion, etc.). 
Néanmoins, les formes différentielles sont d’usage général dans toutes sortes de 
problèmes physiques allant de la thermodynamique à la mécanique, en passant par 
l’électromagnétisme, sans oublier la mécanique des fluides. Le lecteur pourra trou- 
ver utile de consulter d’autres ouvrages, plus approfondis, et notamment ceux de 
H. Flanders (1963), A. Lichnerowicz (1970) et B. Schutz (1985). 

Donnons d’abord une idée simple de cette notion et, à cette fin, plaçons-nous 
dans R? dont nous repérerons les points à l’aide de coordonnées {x};_1 2,3. Soit un 
champ de vecteurs, de composantes A*; un champ de tenseurs, de composantes T', 
et enfin, un autre champ de tenseurs de composantes Q*)*. Considérons maintenant 
les intégrales suivantes ! : 


I= | Aidt’, (B.1) 
Cc 

J= i. T,jdx'dx! , (B.2) 
S 

K= J Qijndz'da dz" . (B.3) 
v 


La première intégrale, J, est une intégrale curviligne étendue à la courbe C et 
son intégrant, 


w = A;dr*, (B.4) 


1. Nous ne nous préoccupons pas, a ce stade, de la position des divers indices. 
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est une forme différentielle de degré 1. L'intégrale J est une intégrale de surface 
étendue à S. Toutefois, une intégrale de surface générale dans R? se présente 
toujours sous la forme - 


f Par dy + Qdydz + Rdzdz; (B.5) 
S 
cela signifie, d’une part, que l’on doit avoir (en un sens à préciser) 


dx dx = dydy = dzdz = 0, (B.6) 


et, d’autre part, que les termes du type dy dx, etc. doivent s’exprimer en fonction 
des termes dz dy, etc. 

Pour préciser un peu cela, considérons deux coordonnées £! et £? sur la surface 
S; cette dernière sera donc décrite paramétriquement ainsi : 


c= ae, £), y= yê, Ey 2 = aE", és (B.7) 


de sorte que l’intégrale (B.5) se réécrit sous la forme 


/ Aiz dé! dé? , (B.8) 


où A2 est une fonction de £! et £? obtenue à partir de (B.7) et de P,Q, R, et 
où l'intégrale (B.8) est étendue à un domaine de R?. L’intégrant dé dé? de cette 
derniére intégrale représente un élément de surface dans R? [Fig. B.1], orienté. 
Autrement dit, si e: et e2 représentent des vecteurs de base (tangents aux lignes 
coordonnées £+ et £7), on aura 


Figure B.1 : Elément de surface orienté dans R?. 


dS = e,dé! À egdé? = e; A eg dé! dé? (B.9) 


où A désigne le produit vectoriel usuel dans R. Il s’ensuit que si l’on échange 
les rôles des vecteurs e;d£é! et e2d£?, ads change de signe mais non de module; 
en outre, cette propriété est, par construction, invariante dans les changements de 
coordonnées sur la surface S. On conçoit finalement qu’ il faille poser 
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dg! dé? = — dé?dg!, (B.10) 


ce qui est, évidemment, compatible avec la propriété (B.6). Dans ces conditions, 
l’intégrale (B.8) se réécrira sous la forme 


J'ai nae’, (B.11) 
où l’on a utilisé la notation 


dé‘ dé = dé À dé, (B.12) 


et où A;; apparaît maintenant comme étant nécessairement un tenseur anti- 
symétrique. De même, l'intégrale J se réécrit sous la forme 


J= Í Tijdr A dx . : (B.13) 
S 


Revenons maintenant à la forme générale (B.5) que l’on a l’habitude d’écrire 
comme 


f V.dÿ, (B.14) 
S 


où V est un vecteur de R3 de composantes (P,Q, R). Comme dS; peut toujours 
s’écrire comme 


1 g 
dS; = ay tik dé) A dé*, (B.15) 


il est clair que l’expression (B.11) se met également sous la forme (B.14) en posant 


1 
Ajk = 2 Eijk y’ ; (B.16) 
cela n’est possible que parce que Ajy est un tenseur antisymétrique de R3. 
Notons enfin que si l’on effectue un changement de coordonnées du type 


Se a (B.17) 


qui change l’orientation de la base {e:, e2}, alors dS; ne change pas de signe (le 
pseudo-tenseur £;,x change de signe ainsi que dé’ À d£?) et la forme différentielle 
(de degré deux) qu’est l’intégrant est invariante. 

Qu’en est-il de l’intégrant de (B.3)? Compte tenu des remarques précédentes, 
on peut l'écrire 


Qijr dz’ À drf À da* . (B.18) 
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Or l'élément différentiel dx À dx? ^ dz“ est totalement antisymétrique en les 
indices (i, j, k). Si l’on veut obtenir un scalaire pour K, il est alors nécessaire que 
Qijk soit proportionnel au pseudo-tenseur Eijk : 


Qijk = PEijk: (B.19) 
Finalement, la forme différentielle (de degré trois) (B.18) est proportionnelle à 
P élément de volume 


Eijk dz’ A dx? A da = 2x. (B.20) 


Remarquons au passage qu’a partir d’une forme différentielle de degré zéro 
(c’est-à-dire, à partir d’une fonction scalaire f), on peut par différentiation obtenir 
une forme de degré un, comme par exemple 


a = df = 0;f-dz' (B.21) 


Nous allons développer ces notions ci-dessous de manière pragmatique et, en 
particulier, l’algèbre extérieure définie ici par les propriétés du “produit vectoriel”? 
A dans R3, et définie plus loin dans le cas de R”. 


Algèbre extérieure 
Considérons un espace vectoriel E sur R à n dimensions et le produit tensoriel 
E®? Nous allons construire l’espace E^? des p-vecteurs : nous poserons E = R 


et EM = E. Le produit extérieur ^ de deux vecteurs x et y quelconques de E 
jouira, par définition, des propriétés suivantes : 


(i)xAy=-yAx 


(ii)x Ax = 0 
(B.22) 
(iii) (Ax, + ux2) Ay = A(xi Ay) + plxeAy) 
(iv) x A ('y1 +uly2) = X(xAy1) + (x Ayo). 
En termes de composantes, avec 
x = ez, y = ey’ (6=1,2,---n), (B.23) 


on aura donc 
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xAy = x'y’ e; Ae; (B.24) 
= N (x y — ry’) e; Ae; . (B.25) 
i<j 


L'espace E^? sera alors défini comme étant l’ensemble de toutes les combi- 
naisons linéaires du type 


J Qijei A€. 


La relation (B.25) indique alors que E^? est identique à l’espace vectoriel des 
tenseurs antisymétriques d'ordre deux. 

De même, £"? est défini de manière similaire et est identique aux tenseurs 
antisymétriques d’ordre p : sa dimension est donc C? et une base est donnée par 


Ctrig in = Ci A e Are: NG, ; 


avec tı < 12 < +++ tp. 

Considérons maintenant les espaces FE? et E^, Sia € EM et B € EM, 
on pourra définir a A 8 € E(P+9) (qui sera 0 ssi p + q > n) qui possédera les 
propriétés suivantes : 


(i) ang est distributif par rapport à l’addition 
(it) aA(BAY) = (aAB)A7 (associativité) (B.26) 
(iii) BAa = (Pia AB. 


Le produit extérieur A^ fait donc passer de l’espace EP x EM à l’espace 
E+), Une opération linéaire A de Æ dans lui-même transforme un élément 
a € EM 


a = a? ei Ae, A+ AG, (B.27) 


en un élément 


al = gta tr A; hA, P. A P Ej, A Eja At ess (B.28) 


t2 tp 


où les indices (51, j2, * : : Jp) des A? doivent être antisymétrisés : 


A. 71. A. 22... A. re; Nej N+ N G5, = 


tj 22 t2 


det A-e;, Ae;, A---Ae;,. (B.29) 
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Le passage de (B.27) à (B.28) est effectué à l’aide du changement de base 


e€; — AjJe;. 


Formes différentielles 


1. Dans R”, considérons l'élément infinitésimal dz* (i = 1,2,---,n) et un 
covecteur A;(z). Par définition, la grandeur 


w = A;dz' (B.30) 


est une forme différentielle de degré un, les dz? formant une base pour l’espace 
vectoriel formé par les w : dz* = ef. On peut donc étudier l’algèbre extérieure des 
formes différentielles et former, par exemple à partir de deux formes analogues à 
la précédente, la forme de degré deux suivante : 


a= Wy A wo 
= AN dz? A AP) dxi 
= AP. AP drê À dei (ij=1,2,-..,n) 
= 5 [APAP — APAP] dot À dad (B.31) 


De manière générale, une forme différentielle de degré p (p < n) s’écrira sous 
la forme 


a= Ani i, dg’! Adz’? A... A dx’? , (B.32) 

où A;,;,...i, est un tenseur antisymétrique. 
2. Etudions l’effet d’un changement de système de coordonnées dans R”; ona 
Ox* 
ax 


de sorte que la forme w (B.30) s’écrit maintenant 


dr? = dz” = A; dx” (B.33) 


Ox? 


= A;dr = A; — 
Ww L Əz” 


dx” = Apdr” (B.34) 


et la forme générale a (B.31) 
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a= Arii dz“ A dz’? AA dz’? 
= Anii dai A dr? A A dir. (B.35) 


Ces dernières relations montrent par identification que 


Ox? 
Ay = oon At 
et que 
Ortiz ip 
Ait init, = Orit ip iiiz: ip (B.36) 
où l’on a posé 
rtiz ip Ərik 
ane T det lage! , (B.37) 


qui représente le jacobien de la transformation {x} — {x’}. Il faut, en effet, se 
souvenir que, dans le passage de la base dz’! A--- Adz‘? à la base di A... Adz’, 
il faut en antisymétriser le coefficient, ce qui donne lieu au déterminant indiqué 
plus haut. 

Considérons, à titre d’exemple, le cas de R? rapporté aux coordonnées 
cartésiennes (x, y) et la forme différentielle de degré deux 


Y= oe dx’ A dx? 
= dz A dy, (B.38) 


c’est-à-dire I’ élément de “volume” usuel dans R?. Passons en coordonnées polaires 
(r, 9) : 


z! = rcosû = x 
i = rsinĝ = y; (B-39) 
on a donc 
dz! = dr cos — rsin6d6 
a = drsin@ + rcosédé , 1840) 


soit encore 
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dx À dy = (drcos@ — rsin6d@) A (drsin@ + r cos 0d0) 


= rcos* 6dr À d@ — rsin? dû A dr 


I) 


rdr \d@ = rdr.dé , (B.41) 


où l’on a utilisé les propriétés d’antisymétrie du produit extérieur. 
3. Considérons dans R? une surface S définie paramétriquement par 


z = (£t, £?) 
y = yé, E?) (B.42) 
a= z(t, E?) 


et une forme différentielle quelconque, par exemple 


w = Adz A dy + Bdx Adz + Cdy Adz, (B.43) 


où A, B et C sont trois fonctions de (x, y, z). Si l’on astreint le point (x, y, z) Ase 
trouver sur la surface S, la forme w se réduit à 


w= Afr(ét,e), yE €), 2(€1,€7)] x 


Ox Ox ð Oy 
x { saree! + sa} A {ae + sae} +... (B.44) 


= {A [x(e*, €2), yet, €), 2(€1,€)] . aan = Re | ne i y 
x dE? A dE? = (E, E? JAE? A dé? . (B.45) 


Cette dernière forme est dite induite par w sur S. Considérons un autre exemple, 
celui où la forme w est de degré 3 : 


w = Y(x,y,2)dx À dy Adz. (B.46) 


Lorsque le point (x, y, z) est astreint à être sur S, w devient 


w= y [ele E) uE €), EE] x 


A Fi + wat} (B.47) 
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résultat que l’on aurait pu prévoir. Supposons maintenant que w soit une forme de 
degré un : 


w = A;(x,y,z)dr*. (B.48) 


On aura, de la même manière que ci-dessus : 


o£! 


dé! + de 


Fer (EE) le), 26.) { ae? (B49) 


Ce résultat se transpose aisément au cas d’une surface 4 p dimensions plongée 
dans R”, pour des formes de degré inférieur ou égal a p. 


Forme “élément de volume” — Formes duales 


1. Considérons, dans R” rapporté à des coordonnées quelconques {x1, x, ..., 
x"}, la forme de degré n 


w = Oe! 7 at dt Adr? A... Adz”. (B.50) 
Dans un autre système de coordonnées {y!,y?,...,y"}, elle s’écrira 


w = vly'y’,...,y™ dy! À dy? A... Ady” , (B.51) 


où les fonctions é(z) et w(y) sont liées par 


2 (ex 
o(x!,x?,...,2") = vy’, y*,...,y™) dét. 2] ; (B.52) 


Comme, d’ autre part, le tenseur métrique g;; se transforme selon 


ôx* Ox! 
Jij = Dy Oy Jkt ; (B.53) 
on a également 
dx*]? 
‘| = [dét. | . ; B.54 
wi = fee So] i (B.54) 


Il s'ensuit que la forme différentielle 


n = VIgldx! A dx? A... A dx" (B.55) 
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conserve la méme forme dans tout changement de coordonnées (qui conserve 
l’orientation des lignes—coordonnées). La forme précédente se réduit visiblement a 
l'élément de volume usuel dV = dx! Adz? A... .Adx” en coordonnées cartésiennes. 

La forme “élément de volume” 7 peut se réécrire, de manière manifestement 
covariante, à l’aide du (pseudo-) tenseur totalement antisymétrique Vale i.i, 
défini par 


+1 si (i1,i2,...,2n) forme une permutation 


2 dye en ies paire de (1,2,...,n) ; (B 56) 
aise —1 s’il s’agit d’une permutation impaire; i 


0 autrement. 


On a ainsi l’expression manifestement covariante cherchée pour 77 : 
1 ; ; ; 
n = = V |9l€isia...in dx" Adr? A.../Adx". (B.57) 
n: 


2. Considérons maintenant une surface S, à p dimensions, plongée dans R”. 
Comment construire un élément de surface, valable a priori, quelle que soit 5? 
D'abord, il doit s’agir d’une forme différentielle de degré p, donc de la forme 
dz™ À dx? A... A dx?. A cela, il faut ajouter que l’ordre des dx‘ doit être 
indifférent. Enfin, le seul tenseur totalement antisymétrique dont nous disposons 
re vigl . Il s’ensuit que la seule forme de degré p qui réponde à ces 
exigences est proportionnelle à 


1 : | : 
dE RE |9]Ei iz.. in dT! À dr? A... A dx’? . (B.58) 


Éptliptain — p 


Dans R, pour une surface ordinaire, à deux dimensions, cette forme différentielle s’écrit, en 
coordonnées cartésiennes, 


dd; = A V1 eijk dx Adz" A (B.59) 
ou encore 
dX, =dyAdz 
dig =dr^dz (B.60) 
d3 =dzxAdy. 


Ainsi, dans R°, dd; se réduit bien à l'élément de surface habituel. Pour être plus spécifique, prenons 
le cas d’une sphère de rayon 1 et adoptons comme coordonnées les variables x et y. On aura 


z= +[1—2?-y?]!/? 5 


et si l’on considère, par exemple, l'hémisphère nord (signe +), on aura 


ma ia rda+vdy} 
—y?]1/? 


dz = 
. {1—a:? 
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qui, introduit dans les expressions précédentes des dX;, donnera 


dE; = ——— — dxAdy 


V i-2?-y? 


dig = —% . drAdy 


V1-xr2-7y? 


= dxAdy. 


Zz 
V/1-22-y 


Nous avons réécrit z dans l'expression de dX3 afin que la symétrie des dX; apparaisse plus 
clairement. On écrira donc, finalement, pour la sphère, 


d£ = 


dE; =n'/gedxAdy , 


où n° est la normale-unité à la surface et où gs est le déterminant de la métrique sur S, c’est-à-dire 


eo age 


3. Considérons dans R” une forme de degré p 


1 | i 
w = pi fitz- dr! A dx’? A... A dx? (B.61) 


où Aiiz..ip Est totalement antisymétrique et où les indices prennent toutes 
les valeurs possibles de 1 à n. A cette forme différentielle, nous allons faire 
correspondre une forme de degré (n — p}, dite forme duale, définie par 
1 aie Be Soo ; 
*w = =v lglEiiz.. in A2 Pdr Pt À dirt? A dr (B.62) 
p: 
où les indices sont relevés, comme toujours, à l’aide du tenseur métrique g* : 
Altta--te = gh gi??? a . grip Aid š (B.63) 


Si Pon définit le produit scalaire de deux formes différentielles de même degré 
p par 


1 PN? 
< a, B >= pl Co PT EE PA €) 122.-.tp (B.64) 


il est facile de vérifier les propriétés suivantes : 
a NB = Lra =<a,B>n (B.65) 
<*a,*8 > = signe (g) <a, > (B.66) 


<a\B,n>=<"a,f > [d (a) =n — p, d (a) =p]. (B.67) 


274 Formes différentielles extérieures 

Si a est de degré p, comme “a est de degré n — p, il s'ensuit que **a est 
également une forme de degré p. Compte tenu des propriétés des pseudo-tenseurs 
de Levi-Civita €; iz...in, On peut montrer que 


**a = (—1)P("-P) signe (g)a . (B.68) 


Par exemple, sin = 4 et p = 2, la forme 


1 Vv 
F= gew dz“ À dx (B.69) 
admet pour forme duale 
1 
°F = 5 Epvab F°? da-n dx”, (B.70) 
et lona 
ere (B.71) 


Dérivation des formes différentielles 


1. Nous avons déjà considéré un exemple simple de dérivation, celui d’une forme 
différentielle de degré 0, c’est-à-dire le cas d’une fonction scalaire : la dérivation 
donne alors une forme de degré 1. Nous allons maintenant définir une opération 
d qui, à une forme de degré p, fait correspondre une forme de degré p + 1. Cette 
opération d jouit des propriétés suivantes : 


(i) d(a+8) = da+df  [d(a) = d(8) 


(ii) d(a A 8) = da A B+(-1)Pa A dB [d (a) = p] (B.72) 

(iii) d(da) = 0. 
La premiére propriété est la linéarité de la dérivation, tandis que la seconde 
constitue |’ analogue de la règle de Leibniz, compte tenu de la propriété (B.26) qui 
doit étre préservée. La derniére propriété peut étre considérée comme une condition 


de cohérence avec le fait que dans R” les formes de degré n + 1 sont identiquement 
nulles. Considérons, en effet, une forme du type 


w = O(2',27,...,a") dz! Adr? A... Adr”. (B.73) 


On aura 
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i=n 
dw = d® Ada’ Adz? A... Adz” +BŸ da A... din... Adz”. (B.74) 
i=l 
Comme, d’une part, dw = 0, et d’autre part d® A dx! A... = 0, il s'ensuit que 
=n : 
Soda A... Ada nr... Adz” = 0; (B.75) 
i=l 


ceci devant être vrai pour chaque n, on en déduit qu’il est nécessaire d’imposer 
d(da*) = 0, quel que soit 7. Par conséquent, il est facile de vérifier que d(da) = 0. 
Cette propriété s’appelle le lemme de Poincaré. 


Les trois conditions ci-dessus sont donc très naturelles et l’on peut démontrer 
que I’ opération d existe et est unique [H. Flanders (1963)]. On vérifie aisément que 


d(@dw) = dd A dw, (B.76) 


et, pour une forme w = A; idz" À dx? A... Adz, que 


dw = =O Abs ig..tip AE" Adz” Adz? A... Adz” 
= (p+ LOR Azis...ip] def Ada Adz? A... Ada.  (B.77) 


Considérons à titre d’exemple dans M” la forme de degré un 
A= A, dz", 


et prenons d.A. On a alors 


dA= 8, À, dx” Ada? 
= 20 Ayj dx” Ada". 


3. Considérons une forme différentielle w telle que 
w = da. (B.78) 


Par définition de l'opération d, on a dw = 0. w est une forme fermée. Une forme 
différentielle w du type précédent est dite exacte. La question qui se pose est alors la 
suivante : une forme w fermée, donc telle que dw = 0, est-elle exacte? Autrement 
dit, a-t-on w = da? En fait, la réponse est positive mais localement [H. Flanders 
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(1963)]. En outre, la forme a n’est visiblement pas unique puisque toute forme 
différentielle a’, telle que 


a =at+dy  (y:forme arbitraire), (B.79) 
est également solution. 


3. On appelle codérivation 6 l'opération définie par 
6 = 4. (B.80) 


Elle vérifie 6? = 0, comme on peut le voir directement. 


Forme différentielle des équations de Maxwell 


Considérons les formes suivantes 2 : 


1 
F= 5 Fw da" À da (B.81) 


J = J, dz", (B.82) 
et appliquons l’opération d à la forme F; il vient 


1 
dF = 5 Op Fu da* À da" A dz” = 0; (B.83) 


on a, en effet, OnF, uv] = 0, en vertu des équations de Maxwell. D’ autre part, on a 
également 


1 
“F = s€uvop FP dz” A dx”, (B.84) 
de sorte que, après quelques calculs, il vient 


d'F = An*T, (B.85) 


en utilisant le second groupe d’équations de Maxwell; ou encore, en prenant le dual 
de cette dernière relation, 


"DF = 6F = ArI . (B.86) 


Ainsi, les équations de Maxwell sont équivalentes aux relations suivantes entre 
formes différentielles : 


2. On trouvera davantage de détails dans Ch. Misner, K. Thorne, J. Wheeler (1973). 
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dF 0 


i 


(B.87) 
F = Arf. 


Ainsi la forme F est une forme fermée. Elle est donc localement une forme 
exacte : il existe une forme À telle que 


F = dA. (B.88) 


F étant une forme de degré 2, À est une forme de degré 1 : 


A = Adz? (B.89) 
et l’on a donc 
1 
F = gr Fur dx” À dx” = dA, A dx” (B.90) 
1 


= D, A, dat Adz” = 5 (0,4, — vAn] da” Ada”,  (B.91) 


c’est-à-dire F,, = 0, A, — 0,A,. On constate également que la non-unicité de 
la forme A exprime les propriétés de jauge des 4-potentiels. Ainsi, lorsque A et A’ 
donnent lieu au même champ F alors A — A’ = dé, où ¢ est une fonction scalaire. 
La forme A obéira alors à la relation 


éd A = 47I . (B.92) 


Intégration des formes différentielles 
Théorème de Stokes 


Plaçons-nous toujours dans R” et considérons une forme différentielle w de 
degré p < n. Il est clair qu’une telle forme ne peut être intégrée que sur une surface 
S17, de dimension q < p, de R”; le symbole 


iz = I, (B.93) 


possède le sens suivant : (i) la forme w est d’abord astreinte à S%, ce qui en fait une 
forme de degré q; (ii) S1 est décomposé en parties disjointes décrite chacune par 
des coordonnées bien définies; (iii) enfin, sur chacune de ces parties — soit © l’une 
d’entre elles - on a 
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i= J f(E,€7,..., 62) dé de? ... dé4 (B.94) 
ECHN 


où {€1,€7,...,€7} est un système de coordonnées qui décrit £. Bien évidemment 
I, ou Iy, ne dépend pas des coordonnées — des variables — choisies. 


Un important théorème est le théorème de Stokes. Soit w une forme différentielle 
et soit V un volume de R” et OV le bord de V : dim.[0V] = dim[V]—1. Le théorème 


de Stokes est la relation 
J dw = f w. (B.95) 
v ov 


Par exemple, dans R3, si V est un volume fini, limité par une surface S = OY, 
on aura 


f alosa À dr] = Joss A dx? , (B.96) 
v S 
ou encore 
f Ou jdz* A dr? \ dx) = [vast A dx! ; (B.97) 
v S 
wij étant totalement antisymétrique, on peut lui associer un vecteur Áp [où i, jetk 


forment une permutation circulaire de (1, 2, 3)], de sorte que la relation précédente 
prend la forme familière 


i, div À x = f À.dS . (B.98) 
v s 
Dans l’espace de Minkowski, la forme w = J#dY, donne 


J d[J"d3,] = | TH, (B.99) 
Vv av 


formule analogue à la précédente dans R3, et qui s’écrit encore 


Í V, J“n = f Jde (B.100) 
y av 


APPENDICE C 


Forme variationnelle 
des équations de champ 


Les équations habituelles du mouvement d’une particule, ou d’un systéme de 
particules, peuvent étre déduites d’un principe variationnel [principe de moindre 
action conduisant, suivant les variables adoptées, soit aux équations de Lagrange, 
soit aux équations d’ Hamilton; cf. H. Goldstein (1980) ou L. Landau et E. Lifschitz, 
Mécanique], aussi bien dans le cas newtonien que dans le cas relativiste [A.O. Barut 
(1965) ou J.L. Anderson (1967)] avec, dans ce dernier cas, quelques subtilités 
concernant la contrainte upu” = 1[G. Kalman (1961); A. Peres, N. Rosen (1960)]. 

De la même manière, les équations satisfaites par des champs (des systèmes 
continus possédant, par conséquent, une infinité de degrés de liberté) de quelque 
nature tensorielle que ce soit, peuvent très souvent être déduites d’un principe 
variationnel; c’est le cas des équations de l’électromagnétisme, par exemple, mais 
pas celui de l’équation de la chaleur. 

De façon générale, pour décrire un mouvement de particule ou l’évolution d’un 
champ, il existe de nombreux procédés analytiques; il n’y a d’ailleurs a priori 
aucune raison de se limiter à des équations différentielles ou aux équations aux 
dérivées partielles du second ordre. 

L'avantage principal d’un formalisme variationnel, c’est qu’il permet, d’une 
part, de trouver assez facilement les grandeurs conservées dans le mouvement 
(i.e., les intégrales premières) et, d’autre part, d’exploiter directement les symétries 
du problème physique considéré, ces deux aspects étant liés comme nous allons le 
voir. En fait, nous n’introduirons ici un tel formalisme que parce qu’il permet de 
définir simplement l’énergie et l’impulsion d’un champ. 

Considérons donc un champ y, de composantes p: (les points désignent des 
indices tensoriels arbitraires), et soit L[p(x), ôw(x)] la densité lagrangienne, liée 
à l’action totale S du champ par 


s= J dtz Lly(z), dp(x)] , (C.1) 
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où l'intégrale est étendue à un volume d’espace-temps compris entre deux surfaces 
du genre espace données quelconques. Ecrivons maintenant que |’ intégrale d’ action 
est minimum pour les champs existant réellement dans la Nature; soit 6S = 0, ou 
encore 


6S = i dz 6 Lip(x), Op(x)| = 0. (C.2) 


En introduisant la variation locale 


dp(x) = p'(x) — p(x) (C.3) 


entre deux champs infiniment voisins y et vy’, il vient successivement 


6S = / d'z {Lp + dy, dp + sdp) — L(y, dp)} 


= J diz E soe Few (| | (C.4) 


Notons qu’il y a sommation sur les indices implicites contenus dans les y, 
9/0(8,4), etc. Nous avons encore utilisé la relation 064 = 60 qui se démontre 
facilement. Intégrant par parties le dernier terme de l’équation (C.4), on obtient 


Jeff -aag + [SE se|} =0 (C.5) 


où l’on a utilisé le fait que les variations de 6y sont supposées nulles aux limites 
du domaine d’intégration : le terme tout intégré provient de l’intégration du dernier 
terme de l’équation (C.5) à l’aide du théorème de Stokes 


OL OL 
4 = 
fe zôu E J Les 58,6 ôy, 


où le terme de droite est nul puisque 64 = 0 sur la surface d’intégration. Comme 
cette dernière équation doit être nulle quel que soit le domaine d’intégration et, 
surtout, quelle que soit la variation dy, on en déduit les équations satisfaites par 4; 
ce sont les équations d’Euler-Lagrange, qui s’écrivent 
OL. OL 
— — Anz = 0. (C.6) 
3p a(3 p) 
A titre d’exemple, considérons le cas du champ scalaire, dont le lagrangien est 
donné par 


1 
Lscal. = > [du 4p — mp] + Ar Jy ; (C.7) 
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les équations d’ Euler-Lagrange s’écrivent alors 


[O4+m? lp = 4m J; (C.8) 


c’est l'équation de Klein-Gordon couplée à la source! J. On vérifie, de même, 
que les équations de Maxwell, écrites sous la forme (5.24), peuvent être retrouvées 
à partir du lagrangien 


LemlA] = =; (o"A" _ Ə! A”): (0, A, — 8,A,) (C9) 
1 i 


ce lagrangien est invariant dans les transformations de jauge. 

Venons-en maintenant aux symétries d’espace-temps et, plus spécialement, à 
l’invariance de la physique dans les translations spatio-temporelles (homogénéité 
de l’espace et uniformité du temps). En effet, l’ énergie et l'impulsion d’un système 
physique — classique ou quantique, relativiste ou non, constitué de particules et/ou 
de champs — sont définies comme étant les constantes du mouvement associées à 
ces symétries : l’énergie à l’uniformité du temps, l’impulsion à l’homogénéité 
de l’espace. Imposons donc l’invariance de l’action S dans des translations 
infinitésimales d’espace—temps : 


gh = gh 4 eH. (C.11) 


Il est clair que si les limites d’intégration de l’action ne font pas également l’objet 
d’une variation, le système ne sera pas invariant dans la transformation (C.11), non 
plus que dans d’autres variations spatio-temporelles (transformations de Lorentz, 
dilatations). Ceci peut être effectué [A.O. Barut (1965)] mais il est plus simple de 
raisonner comme C. Itzykson et J.P. Zuber (1980) qui introduisent dans l’équation 
(C.11) une variation €” qui dépend du point d’espace-temps £” = e” (x). Dans ces 
conditions, les variations de g{x) et 0,,6(z) s'écrivent respectivement 


p(z) = e" (x) 3 p(z) (C.12) 


ð ple) = dupl + €) — LHT) 


Oy [e (x) 8,4(x)| 


= €” (x) Ow G(x) + O, (x): OLE” (x) . (C.13) 


1. Le facteur 47r est purement conventionnel. 
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Reportant maintenant ces deux dernières relations dans la variation de l’intégrale 
d’action et intégrant par parties le terme en 0,e”(x), il vient 


OL 

68 | daela far- Ferns }}=0, C.14 

qui doit être vraie quelle que soit la fonction e” (x). Il s’ensuit que la grandeur 

OL 
TH = — 0" 6 — n°L C.15 
50,0)" E 
est conservée, i.e. que 

b T” =0. (C.16) 


Ce tenseur est le tenseur impulsion-énergie ? du champ ¢. Il représente, en 
quelque sorte, une densité d’impulsion et d’énergie du champ. La grandeur globale 
associée, soit P#, est l’énergie-impulsion totale contenue dans le champ y. En 
effet, P” se conserve au cours du temps ou, ce qui revient au même, possède la 
même valeur quelle que soit la surface du genre espace sur laquelle on l’évalue. 
Montrons-le en utilisant le théorème de Stokes; nous avons 


PH(E) = [oe TH” (C.17) 


et nous voulons montrer que, précisément, P” (>) est indépendant de X, ou encore 
que 
2 P#(E) = 0. (C.18) 
62 
Autrement dit, si nous modifions d’une quantité 6% la surface X, nous souhaitons 
montrer que 


P#(E + 6h) = P(X). 
Ecrivons donc cette dernière relation de manière explicite et intégrons T#* sur 


la surface du genre espace définie par X et © + 62 [Fig. C.1]. Le théorème de 
Stokes nous donne alors 


=, 
» 


Figure C.1 : Grandeurs conservatives. Elles sont indépendantes de la surface sur laquelle on intègre 
la densité correspondante. Pour le voir, il suffit d'appliquer le théorème de Stokes au volume compris 
entre les surfaces (arbitraires) X et N+6X. 


2. Ou encore tenseur d’énergie-impulsion : les deux termes sont synonymes. 
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J D Fe" = f d'z 0, T” (C.19) 


(le domaine d’intégration de ces deux intégrales est indiqué en grisé sur la figure). 
Comme la dernière intégrale est nulle [cf. Eq. (C.16)], il en découle que la première 
l’est aussi et donc que les intégrales de surfaces étendues à © et à E + 6Y sont 
égales. 

En général, le tenseur énergie-impulsion canonique (c’est-à-dire celui qui est 
calculé à l’aide d’un lagrangien) n’est pas symétrique; toutefois, on peut toujours 
le rendre symétrique en lui ajoutant un terme de divergence nulle [A.O. Barut 
(1965)]. En effet, de même que le lagrangien d’un système mécanique est défini à 
une dérivée totale près (c’est-à-dire à une dérivée le long du mouvement près), le 
lagrangien d’un champ est défini à des termes de divergence nulle près. Pour s’en 
rendre compte, il suffit d’ajouter un tel terme à un lagrangien arbitraire : dans le 
processus de variation de l’action, nous avons utilisé une intégration par parties; 
ici, on obtiendra des termes tout intégrés, qui seront nuls en vertu de l’hypothèse 
de variations nulles des champs 4 aux bornes du domaine d’intégration. 

Considérons deux exemples de tenseurs impulsion—énergie, le cas du champ 
scalaire et celui du temps électromagnétique. On obtient respectivement : 


1 ‘ 
Tyvscal = O OP — 5 Tv [(Oy)? = mp + 8r Jy] (C.20) 


1 
Tyvem = Fà- Fyy + que Pro FX. 


Le calcul explicite de Tooem donne 


1 
Toovem = 5 [E* +B’, (C.21) 


qui nest autre que |’ expression habituelle de la densité d’ énergie électromagnétique, 
tandis que J est donné par 


T” = (EAB); (C.22) 


c’est le vecteur de Poynting. 


APPENDICE D 


Notion de variété 


La notion de variété, et plus précisément celle de variété différentiable, est 
fondamentale en Relativité Générale. Cette notion généralise celle de surface, 
plongée dans un espace euclidien ou pseudo-euclidien; bien plus, elle s’ applique à 
toutes sortes d’autres objets mathématiques, comme les groupes continus (groupes 
de Lie) — tels le groupe des rotations ou le groupe de Lorentz — comme l’espace 
de phase d’un système mécanique composé de N particules (c’est-à-dire l’espace 
des {q’, pi}i=1,2,...,n où les g’ sont des coordonnées généralisées et où les p; sont 
les moments canoniquement conjugués), etc. 

Avant de définir ce qu’est une variété et d’en énoncer les principales propriétés, 
il convient d'acquérir quelque intuition dans des cas simples, tel celui de la sphère 
usuelle $°, plongée dans R°. Considérons donc une sphère, de rayon unité, définie 
paramétriquement par les relations 


x = cos y.sin 0 
y = sin y.sin 6 (D.1) 
z = cos 0. 


Un point courant de la sphère S? va donc être déterminé par la donnée des deux 
coordonnées (0, p) et les relations (D.1) vont constituer une application de S$? dans 
R3, c’est-à-dire un plongement de la sphère dans l’espace euclidien. On peut, 
toutefois, considérer cela un peu différemment : à un point de S?, on associe les 
coordonnées (0, p), c’est-à-dire un point d’un espace R? [Fig. D.1]. Examinons 
cela d’un peu plus près. Quelles sont les coordonnées du pôle nord de la sphère? 
Il est aisé de vérifier que ce point a pour coordonnées (0, y) où y est arbitraire! 
Autrement dit, le pôle nord est représenté non pas par un point du plan (8, 4), mais 
par un segment de droite. À cette première anomalie du système de coordonnées 
s’en ajoute une seconde. Considérons, en effet, un point quelconque du méridien 
yp = 0, soit un point de coordonnées (0, y) : il peut également être représenté par 
le point (2x, 0) dans l’espace R? des couples (8, p). Si l’on souhaite obtenir une 
représentation de 9? dans R?, il est nécessaire d’éliminer ces pathologies, et donc 
d’exclure les frontières qui posent problème. Il s’ensuit qu’une partie seulement 
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de la sphère — S? privée d’un demi-grand cercle allant d’un pôle à l’autre — est 
représentée correctement dans un ensemble ouvert (en l’occurrence, un rectangle 
privé de ses côtés) de R? : à un point de S? correspond un, et un seul, point de cet 
ouvert, et réciproquement. 


O 27 o 


Figure D.1 : Représentation de la sphère $? dans R*. Quoique les coordonnées sphériques (8,6) 
soient telles que O<O<x et O<y<2n, il est nécessaire de limiter les variations de 8 et p de manière à 
exclure les bornes. Faute de quoi, un point du méridien p=0 serait représenté par deux points de R? 
et le pôle nord (resp. le pôle sud) par un segment de droite. Dans ces conditions, seule une partie de la 
sphère est représentée par ce système de coordonnées, et elle l'est dans un ouvert de R? : le rectangle 
indiqué sur la figure, frontière exclue. 


Une telle représentation (c’est-à-dire la donnée d’un ensemble ouvert de S? et 
de l'application dans R?) constitue une carte locale de la sphère, carte incomplète 
comme nous venons de le voir : une partie ouverte de la sphère (celle indiquée plus 
haut) est correctement représentée dans un rectangle ouvert de R?. 

Si nous voulons représenter toute la sphère, il nous faudra disposer d’une autre 
carte : on peut, par exemple, utiliser des coordonnées polaires différentes, qui 
ne permettront pas de représenter un autre demi-grand cercle [Fig. D.2] sans 
intersection avec le premier. L'ensemble de ces deux cartes permettra de décrire 
toute la sphère : c’est ce qu’on appelle d’ordinaire un atlas. Bien entendu, les deux 
systèmes de coordonnées doivent donner des résultats cohérents dans les régions 
de S? où ils sont tous deux définis. 

Ace stade, on pourrait arguer de ce que nous n’ avons pas choisi un “bon” système 
de coordonnées, aussi étudierons—nous, à titre d'exemple, d’autres systèmes de 
coordonnées. Considérons donc la carte locale constituée par la demi—sphére 
ouverte 


Il <1,{yl <1,2 = +V1- 72-72 (D.2) 


et l’application de S? dans R? définie par les coordonnées (x, y). Dans R?, l’image 
de la demi-sphère est constituée par le disque ouvert 


P+yP<l (D.3) 
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Figure D.2 : A l’aide des coordonnées polaires usuelles on représente la sphère S? privée du méridien 
notée (1). À l’aide d'un autre système de coordonnées polaires (celui indiqué sur la figure correspond 
au choix de l’axe Ox comme “axe des z”), on décrit S? privée du méridien notée (2) : ce second système 
de coordonnées permet donc de décrire également les points de (1). 


Figure D.3 : Comparaison de deux cartes locales sur la sphère S°. Les coordonnées polaires 
permettent de représenter la sphère dans l’ouvert Vi de R? (application Y) et les coordonnées (x,y) 
dans l'ouvert Vz de R?. Les régions communes de S? sont représentées par les régions plus foncées 
dans Vi et Vz. 


[Fig. D.3]. Pour recouvrir complètement la sphère, il est nécessaire de disposer 
d’autres cartes locales. On peut, par exemple, utiliser, outre la relation (D.2), les 
ouverts 


(i)x > 0, (ü)y>0, (D.4) 
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qui constituent autant de demi—sphéres (ouvertes), et auxquels il faut adjoindre 
S? — (D.2) — (D.4) (ouvert). Cet exemple montre qu’un atlas de la sphère ne 
peut être constitué que de plusieurs cartes : on peut, en effet, démontrer qu’il faut 
au moins deux cartes pour représenter — pour recouvrir — complètement la sphère. 
Cette circonstance est tout à fait générale et, étant donnée une surface quelconque, 
il n’existe pas a priori de système de coordonnées qui en permette la description 
in extenso. 

Tl est intéressant de comparer deux systèmes de coordonnées : dans une région 
commune de S?, ils doivent donner des résultats semblables; autrement dit, dans 
l’intersection de deux cartes locales, on doit pouvoir passer d’un système à l’autre. 

A cet égard, la figure D.3 illustre le cas où la première carte locale, soit {V,, V1}, 
est constituée par la demi—sphére ouverte y > 0 et les coordonnées polaires (0, p) 
astreintes à 0 < (0,4) < 7, tandis que la seconde carte locale, i.e. {V2, Vo}, est 
constituée par la demi-sphère ouverte z > 0 etles projections (x, y). Naturellement, 
dans |’ intersection de ces deux demi—sphéres (i.e. dans le quart de sphère y, z > 0), 
les deux systèmes de coordonnées sont liés par 


C = sin 9. cos (D.5) 
y =siné.sing 
où 6 et y sont astreints cette fois à 
0<0<7/2 
k LPT. (D6) 


Les diverses applications de $? dans R?, qui servent à définir des cartes locales, 
doivent également posséder une importante propriété : étant donnés deux points 
voisins de S?, on souhaite obtenir deux points représentatifs voisins dans R?; 
réciproquement, deux points voisins de la carte doivent représenter deux points 
voisins de §?. Autrement dit, l’application W de S? dans R? doit être continue 
ainsi que son inverse : à un ouvert quelconque de R? correspond un ouvert de 5? 
et réciproquement; Ÿ est un homéomorphisme. 


Variétés différentiables 


L'exemple précédent est instructif à bien des égards et peut être généralisé à des 
surfaces de dimension quelconque plongées dans R”. Toutefois, la notion de variété 
va au-delà de ce cas : une variété est définie intrinsèquement, indépendamment d’un 
plongement éventuel dans un R”; c’est un objet mathématique en soi. Ainsi, une 
variété quelconque diffère d’un espace vectoriel sur de nombreux points : il n’y a 
ni origine, ni multiplication par un scalaire, ni addition, ni notion de parallélisme à 
distance, ni même de champ de vecteurs constant. La structure linéaire d’un espace 
vectoriel est perdue au bénéfice des changements de coordonnées curvilignes et de 
la covariance qui y est attachée. 
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) TS 


Figure D.4 : Notion de variété. A un point M du sous-ensemble ouvert V de la variété V“ correspond un 
point P de R” ; à l’ouvert V correspond l’ouvert U de R” et réciproquement. Si M et M’ sont des points 
voisins de U dans R”, leurs homologues P et P', dans R”, sont également voisins et réciproquement. 


On appellera variété à n dimensions V” un ensemble localement homéomorphe à 
un ouvert de R”. Autrement dit, un élément d’une partie ouverte quelconque d’une 
variété à n dimensions est représenté par un point de R” (i.e. par n paramètres), 
élément d’un sous-ensemble ouvert; réciproquement, à un élément d’un ouvert 
quelconque de R” correspond un, et un seul, point d’un ouvert de la variété; en outre, 
cette correspondance est bicontinue [Fig. D.4]. Intuitivement, cela signifie encore 
que V” est localement “du même type” que R”; V” possède la même topologie 
— la même notion de continuité — que R”. Les nombres £(M),€?(M),...,£(M) 
sont les coordonnées de M. Comme précédemment, la donnée d’un ouvert V de 
Y” et d’une application Y, injective et bicontinue (un homéomorphisme), {V, V}, 
s’appelle une carte. De même, la donnée d’une famille dénombrable d’ ouverts V; 
de V” qui recouvre la variété et d’homéomorphismes Y;, c’est-à-dire la donnée 
d’une famille dénombrable de cartes locales {V;, V;}, s’appelle un atlas. 


RES 
op 


Figure D.5 : Les deux ouverts V, et Va de V" ont une intersection non vide. Un point de l'intersection 
est alors représenté de deux manières différentes dans R.” : Y, donne lieu aux coordonnées {£*} et V2 
aux coordonnées {n°} du même point M. 


Etant données deux cartes locales { Vi, Y1} et {V2, Vo}, où Vi et V2 possèdent 
des points communs, il est clair que ceux-ci vont avoir deux représentations 
possibles — deux systèmes de coordonnées différents — dans R” [Fig. D.5]. Si l’on 
appelle respectivement {E°} et {n°} les coordonnées d’un point M, commun à Vi 
et V2, le passage de l’un à l’autre système s’effectuera à l’aide de la transformation 
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[Fig. D.6] suivante yp : 
gp = VWoby!. (D.7) 


Soit, en effet, un point P de VA, représentant un point M de V” : P, = Y1(M). 
Dans Vo, le point représentatif de M, soit P2, est Vo(M) : Pz = Vo(M).Sivestle 
changement de système de coordonnées cherché, c’est-à-dire tel que Pz = @(P:), 
il est clair que l’on a Y2(M) = p[Y1(M)], d’où découle la relation (D.7). 


Une variété différentiable est alors une variété telle que toutes les applications 
possibles ! pij = Yo; ! soient différentiables. Pratiquement, cela signifie que 
les changements de coordonnées constituent des fonctions différentiables. De ces 
définitions découle le fait que l’on puisse, par exemple, y définir des formes 
différentielles, une notion d'intégration, etc. 


Figure D.6 : Le changement de coordonnées V2 correspond au diagramme ci-dessus, c'est-à-dire à 
s$ 
p=V20v,-. 


1. Bien entendu, p;;=7, l'application identique. 
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(unités en CGS sauf indication contraire) 


c = 2,99792458 1010 

à = 1.05457266 10-2” = 6.582122 10-2? MeV s 
kBottz = 1.3806513 10716 = 8.617344 1071! MeV/K 
e = 4.8032068 107 1° 

a= e*/he = 137.0359895~! 

G = 6.67259 107-8 

g = 980.665 


Mélectron = 0.91093897 1072” = 0.51099906 MeV = 5.92989 109 K 
Mproton = 1.6726231 10-74 = 938.27231 MeV = 1.0888184 1015 K 
Mneutron = 1.6749286 10724 = 939.56563 MeV = 1.0903193 105 K 
Mz+ = 2.488018 10725 = 139.5675 MeV 
Mae = 2.406129 10725 = 134.9739 MeV 
Acetectron = 3-86159323 10711 

Cecctron = 1:73660252 1031 
= 2.10308937 10-14 


Cproton 


X son = 1-07504542 1041 
Neneutron = 2-10019445 107 14 
Az? = 1.0794971 104 


Cneutron 


Aca = 1.413847 10-88 
Xeno = 1.461964 10713 


MeV = 1.60217733 1076 = 5.0677289 107% fm! = 1.16045 101° K 
gramme = 5.6095862 1025 MeV 

fermi” | = 197.32705 MeV 

seconde”! = 1.5192669 107! MeV 

Ry = 1/2 a?m,c? = 2.1798741 10711 = 13.6056981 eV 


Te (rayon classique de l’électron) = €? /Mec? = 2.81794092 10713 
OT (section efficace de Thompson) = 87 / 3r2 = 0.66524616 10724 


Í Compilation de H. Sivak. 
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ao (rayon de Bohr) = h? /mee? = 0.529177249 10-8 
LB (magnéton de Bohr) = eñ/2m,.c = 9.2740154 10-2! 
HN (magnéton nucléaire) = eh/2m,c = 5.0507866 10-24 
N 4 (nombre d’Avogadro) = 6.0221367 1023 
© (constante de Stefan-Boltzmann) = 7°?k%,/60h%c? = 5.670399 10-5 
= 6.418014 10411 /cm?s MeV? 


Unités absolues 


énergie = \/ c3 /G = 1.95633 1016 
temps = \/AG/c°? = 5.39056 10744 


longueur = \/AG/c3 = 1.61605 10733 
masse = \/hc/G = 2.17671 1075 


Astrophysique 


Ho (constante de Hubble) = 100ho km/s Mpc = (0.97781 10!9q)-2 ho 
(0.4 < ho < 1) 

to (âge de Univers) = 1.5 101a 

Po (densité critique) = 1.87882 107292 

Plocal (densité locale) = 0.3M e V/cm? & 3104 Pe 

Mstellaire = 3.676 1033 

Msoleit = 1.989 1033 

MTerre = 5.977 1027 

MLune = 7.35 1025 

T Soleil = 6.9598 10°km 

TTerre = 6.37817 10%km 

TLune = 1.738 10%km 

parsec = 3,0856775806 1018 = 3.2615 al 

a l (année-lumière) = 0.946 1018 
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non relativiste 90 
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